Python实现一个优先级队列的方法

作者:David Beazley 时间:2022-12-03 14:44:54 

问题

怎样实现一个按优先级排序的队列? 并且在这个队列上面每次 pop 操作总是返回优先级最高的那个元素

解决方案

下面的类利用 heapq 模块实现了一个简单的优先级队列:


import heapq

class PriorityQueue:
def __init__(self):
 self._queue = []
 self._index = 0

def push(self, item, priority):
 heapq.heappush(self._queue, (-priority, self._index, item))
 self._index += 1

def pop(self):
 return heapq.heappop(self._queue)[-1]

下面是它的使用方式:


>>> class Item:
...  def __init__(self, name):
...   self.name = name
...  def __repr__(self):
...   return 'Item({!r})'.format(self.name)
...
>>> q = PriorityQueue()
>>> q.push(Item('foo'), 1)
>>> q.push(Item('bar'), 5)
>>> q.push(Item('spam'), 4)
>>> q.push(Item('grok'), 1)
>>> q.pop()
Item('bar')
>>> q.pop()
Item('spam')
>>> q.pop()
Item('foo')
>>> q.pop()
Item('grok')
>>>

仔细观察可以发现,第一个 pop() 操作返回优先级最高的元素。 另外注意到如果两个有着相同优先级的元素( foogrok ),pop 操作按照它们 * 入到队列的顺序返回的。

讨论

这一小节我们主要关注 heapq 模块的使用。 函数 heapq.heappush() heapq.heappop() 分别在队列 _queue 上插入和删除第一个元素, 并且队列 _queue 保证第一个元素拥有最高优先级( 1.4 节已经讨论过这个问题)。 heappop() 函数总是返回”最小的”的元素,这就是保证队列pop操作返回正确元素的关键。 另外,由于 push 和 pop 操作时间复杂度为 O(log N),其中 N 是堆的大小,因此就算是 N 很大的时候它们运行速度也依旧很快。

在上面代码中,队列包含了一个 (-priority, index, item) 的元组。 优先级为负数的目的是使得元素按照优先级从高到低排序。 这个跟普通的按优先级从低到高排序的堆排序恰巧相反。

index 变量的作用是保证同等优先级元素的正确排序。 通过保存一个不断增加的 index 下标变量,可以确保元素按照它们插入的顺序排序。 而且, index 变量也在相同优先级元素比较的时候起到重要作用。

为了阐明这些,先假定 Item 实例是不支持排序的:


>>> a = Item('foo')
>>> b = Item('bar')
>>> a < b
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: unorderable types: Item() < Item()
>>>

如果你使用元组 (priority, item) ,只要两个元素的优先级不同就能比较。 但是如果两个元素优先级一样的话,那么比较操作就会跟之前一样出错:


>>> a = (1, Item('foo'))
>>> b = (5, Item('bar'))
>>> a < b
True
>>> c = (1, Item('grok'))
>>> a < c
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: unorderable types: Item() < Item()
>>>

通过引入另外的 index 变量组成三元组 (priority, index, item) ,就能很好的避免上面的错误, 因为不可能有两个元素有相同的 index 值。Python 在做元组比较时候,如果前面的比较已经可以确定结果了, 后面的比较操作就不会发生了:


>>> a = (1, 0, Item('foo'))
>>> b = (5, 1, Item('bar'))
>>> c = (1, 2, Item('grok'))
>>> a < b
True
>>> a < c
True
>>>

如果你想在多个线程中使用同一个队列,那么你需要增加适当的锁和信号量机制。 可以查看 12.3 小节的例子演示是怎样做的。

heapq 模块的官方文档有更详细的例子程序以及对于堆理论及其实现的详细说明。

来源:https://python3-cookbook.readthedocs.io/zh_CN/latest/c01/p05_implement_a_priority_queue.html

标签:Python,优先级,队列
0
投稿

猜你喜欢

  • python3中超级好用的日志模块-loguru模块使用详解

    2022-03-08 19:08:54
  • MySQL数据库查询性能优化的4个技巧干货

    2024-01-13 23:25:16
  • SQL进行排序、分组、统计的10个新技巧分享

    2024-01-17 22:44:12
  • Linux环境下安装MySQL8.0的完整步骤

    2024-01-22 05:26:47
  • Python趣味挑战之用pygame实现飞机塔防游戏

    2022-07-18 04:00:02
  • python3 scrapy框架的执行流程

    2022-04-12 08:53:35
  • 面向对象设计过程中必须遵守的相关准则

    2009-01-08 15:52:00
  • 一句Sql把纵向表转为横向表,并分别分组求平均和总平均值

    2024-01-22 19:30:37
  • Web开发技术发展史话

    2011-04-25 19:16:00
  • python中星号变量的几种特殊用法

    2021-03-20 10:57:50
  • 开心网上input输入框研究

    2009-03-06 12:52:00
  • Python搭建代理IP池实现检测IP的方法

    2023-10-05 04:42:51
  • Python爬虫Scrapy框架IP代理的配置与调试

    2022-09-19 08:20:26
  • 图文详解Python如何导入自己编写的py文件

    2022-07-08 21:59:28
  • MySQL数据库的索引原理与慢SQL优化的5大原则

    2024-01-18 14:46:01
  • 全面理解Python中self的用法

    2022-10-09 07:16:50
  • Python保存数据至MySQL时中文问题

    2011-02-23 12:06:00
  • Python创建对称矩阵的方法示例【基于numpy模块】

    2021-01-03 07:35:59
  • Tensorflow之Saver的用法详解

    2023-10-01 22:40:07
  • 《CSS权威指南》文摘(1)--块级元素、行内元素

    2008-04-05 13:42:00
  • asp之家 网络编程 m.aspxhome.com