Django中Aggregation聚合的基本使用方法

作者:lunarian 时间:2023-09-15 02:38:29 

Django 的 filter、exclude 等方法使得对数据库的查询很方便了。这在数据量较小的时候还不错,但如果数据量很大,或者查询条件比较复杂,那么查询效率就会很低。

提高数据库查询效率可以通过原生 SQL 语句来实现,但是它的缺点就是需要开发者熟练掌握 SQL。倘若查询条件是动态变化的,则编写 SQL 会更加困难。

对于以便捷著称的 Django,怎么能忍受这样的事。于是就有了 Aggregation聚合 。

聚合最好的例子就是官网给的案例了:


# models.py

from django.db import models

class Author(models.Model):
 name = models.CharField(max_length=100)
 age = models.IntegerField()

class Publisher(models.Model):
 name = models.CharField(max_length=300)

class Book(models.Model):
 name = models.CharField(max_length=300)
 pages = models.IntegerField()
 price = models.DecimalField(max_digits=10, decimal_places=2)
 rating = models.FloatField()
 authors = models.ManyToManyField(Author)
 publisher = models.ForeignKey(Publisher, on_delete=models.CASCADE)
 pubdate = models.DateField()

class Store(models.Model):
 name = models.CharField(max_length=300)
 books = models.ManyToManyField(Book)

接下来可以这样求所有书籍的平均价格:


>>> from django.db.models import Avg, Max, Min

>>> Book.objects.all().aggregate(Avg('price'))
{'price__avg': Decimal('30.67')}

实际上可以省掉 all() :


>>> Book.objects.aggregate(Avg('price'))
{'price__avg': Decimal('30.67')}

还可以指定返回的键名:


>>> Book.objects.aggregate(price_avg=Avg('price'))
{'price_avg': Decimal('30.67')}

如果要获取所有书籍中的最高价格:


>>> Book.objects.aggregate(Max('price'))
{'price__max': Decimal('44')}

获取所有书籍中的最低价格:


>>> Book.objects.aggregate(Min('price'))
{'price__min': Decimal('12')}

aggregate() 方法返回的不再是 QuerySet 了,而是一个包含查询结果的字典。如果我要对 QerySet 中每个元素都进行聚合计算、并且返回的仍然是 QuerySet ,那就要用到 annotate() 方法了。

annotate 翻译过来就是 注解 ,它的作用有点像给 QuerySet 中的每个元素临时贴上一个临时的字段,字段的值是分组聚合运算的结果。

比方说要给查询集中的每本书籍都增加一个字段,字段内容是外链到书籍的作者的数量:


>>> from django.db.models import Count

>>> q = Book.objects.annotate(Count('authors'))
>>> q[0].authors__count
3

与 aggregate() 的语法类似,也可以给这个字段自定义个名字:


>>> q = Book.objects.annotate(a_count=Count('authors'))

跨外链查询字段也是可以的:


>>> s = Store.objects.annotate(min_price=Min('books__price'), max_price=Max('books__price'))

>>> s[0].min_price
Decimal('12')
>>> s[0].max_price
Decimal('44')

既然 annotate() 返回的是查询集,那么自然也可以和 filter() 、 exclude() 等查询方法组合使用:


>>> b = Book.objects.filter(name__startswith="Django").annotate(num_authors=Count('authors'))
>>> b[0].num_authors
4

联用的时候 filter 、 annotate 的顺序会影响返回结果,所以逻辑要想清楚。

也可以排序:


>>> Book.objects.annotate(num_authors=Count('authors')).order_by('num_authors')

总而言之, aggregate 和 annotate 用于组合查询。当你需要对某些字段进行聚合操作时(比如Sum, Avg, Max),请使用 aggregate 。如果你想要对数据集先进行分组(Group By)然后再进行某些聚合操作或排序时,请使用 annotate 。

进行此类查询有时候容易让人迷惑,如果你对查询的结果有任何的疑问,最好的方法就是直接查看它所执行的 SQL 原始语句,像这样:


>>> b = Book.objects.annotate(num_authors=Count('authors')).order_by('num_authors')
>>> print(b.query)
SELECT "aggregation_book"."id", "aggregation_book"."name",
"aggregation_book"."pages", "aggregation_book"."price",
"aggregation_book"."rating", "aggregation_book"."publisher_id",
"aggregation_book"."pubdate", COUNT("aggregation_book_authors"."author_id")
AS "num_authors" FROM "aggregation_book" LEFT OUTER JOIN "aggregation_book_authors"
ON ("aggregation_book"."id" = "aggregation_book_authors"."book_id")
GROUP BY "aggregation_book"."id", "aggregation_book"."name",
"aggregation_book"."pages", "aggregation_book"."price",
"aggregation_book"."rating", "aggregation_book"."publisher_id",
"aggregation_book"."pubdate"
ORDER BY "num_authors" ASC

相关文档: Aggregation

复合使用聚合时的相互干扰问题: Count and Sum annotations interfere with each other

来源:https://segmentfault.com/a/1190000023097440

标签:django,aggregation,聚合
0
投稿

猜你喜欢

  • Python用来做Web开发的优势有哪些

    2023-07-20 19:23:53
  • Python实现动态条形图绘制的示例代码

    2021-09-25 03:05:17
  • Python爬取用户观影数据并分析用户与电影之间的隐藏信息!

    2022-09-09 23:19:47
  • python利用dir函数查看类中所有成员函数示例代码

    2021-02-17 19:06:23
  • sql如何在线创建新表?

    2010-06-22 21:21:00
  • php全局变量和类配合使用深刻理解

    2023-11-18 19:50:17
  • Python运维开发之psutil库的使用详解

    2023-10-24 14:22:55
  • 利用Python抢回在蚂蚁森林逝去的能量(实现代码)

    2022-07-01 15:15:39
  • python中for语句简单遍历数据的方法

    2023-04-18 11:26:45
  • python基于搜索引擎实现文章查重功能

    2022-01-21 19:25:50
  • Webpack path与publicPath的区别详解

    2024-04-29 13:37:49
  • Vue.js绑定HTML class数组语法错误的原因分析

    2024-04-30 10:20:07
  • 在keras里面实现计算f1-score的代码

    2021-12-13 08:39:43
  • 教你如何在Pygame 中移动你的游戏角色

    2022-03-29 10:04:29
  • vue中el-table两个表尾合计行联动同步滚动条实例代码

    2023-07-02 17:08:56
  • 《悟透JavaScript》感谢语

    2008-11-12 12:59:00
  • 利用pyinstaller打包exe文件的基本教程

    2022-06-09 12:32:13
  • python编写学生成绩管理系统的逻辑结构及功能实现

    2021-08-23 18:32:21
  • python datetime中strptime用法详解

    2022-03-08 19:31:48
  • 使用c#构造date数据类型

    2024-01-15 22:19:15
  • asp之家 网络编程 m.aspxhome.com