LRUCache的实现原理及利用python实现的方法

作者:蒂米 时间:2022-06-26 06:51:51 

简介

LRU(Least Recently Used)最近最少使用,最近有时间和空间最近的歧义,所以我更喜欢叫它近期最少使用算法。它的核心思想是,如果一个数据被访问过,我们有理由相信它在将来被访问的概率就越高。于是当LRU缓存达到设定的最大值时将缓存中近期最少使用的对象移除。LRUCache内部使用LinkedHashMap来存储key-value键值对,并将LinkedHashMap设置为访问顺序来体现LRU算法。

无论是对某个key的get,还是set都算做是对该key的一次使用。当set一个不存在的key,并且LRU Cache中key的数量超过cache size的时候,需要将使用时间距离现在最长的那个key从LRU Cache中清除。

LRU Cache实现

在Java中,LRUCache是通过LinkedHashMap实现的。鄙人照猫画虎,实现一个Python版的LRU Cache(可能和其他大神的实现有所区别)。

首先,需要说明的是:

LRU Cache对象内部会维护一个 双端循环链表 的 头节点

LRU Cache对象内部会维护一个dict

内部dict的value都是Entry对象,每个Entry对象包含:

  • key的hash_code(hash_code = hash(key),在本实现中,hash_code相同的不同key,会被当作一个key来处理。因此,对于自定义类,应该实现魔术方法:__hash__)

  • v - (key, value)对中的value

  • prev - 前一个对象

  • next - 后一个对象

具体实现是:

当从LRU Cache中get一个key的时候:

  • 计算该key的hash_code

  • 从内部dict中获取到entry

  • 将该entry移动到 双端循环链表 的 第一个位置

  • 返回entry.value

当向LRU Cache中set一个(key, value)对的时候:

计算该key的hash_code,

从LRU Cache的内部dict中,取出该hash_code对应的old_entry(可能不存在),然后根据(key, value)对生成一个new_entry,之后执行:

  • dict[hash_code] = new_entry

  • 将new_entry提到 双端循环链表 的第一个位置

  • 如果old_entry存在,则从链表中删除old_entry

  • 如果是新增了一个(key, value)对,并且cache中key的数量超过了cache size,那么将双端链表的最后一个元素删除(该元素就是那个最近最少被使用的元素),并且从内部dict中删除该元素

HashMap的实现原理

(面试过程中也经常会被问到):数组和链表组合成的链表散列结构,通过hash算法,尽量将数组中的数据分布均匀,如果hashcode相同再比较equals方法,如果equals方法返回false,那么就将数据以链表的形式存储在数组的对应位置,并将之前在该位置的数据往链表的后面移动,并记录一个next属性,来指示后移的那个数据。

注意:数组中保存的是entry(其中保存的是键值)

Python实现


class Entry:
def __init__(self, hash_code, v, prev=None, next=None):
self.hash_code = hash_code
self.v = v
self.prev = prev
self.next = next

def __str__(self):
return "Entry{hash_code=%d, v=%s}" % (
 self.hash_code, self.v)
__repr__ = __str__

class LRUCache:
def __init__(self, max_size):
self._max_size = max_size
self._dict = dict()
self._head = Entry(None, None)
self._head.prev = self._head
self._head.next = self._head

def __setitem__(self, k, v):
try:
 hash_code = hash(k)
except TypeError:
 raise

old_entry = self._dict.get(hash_code)
new_entry = Entry(hash_code, v)
self._dict[hash_code] = new_entry

if old_entry:
 prev = old_entry.prev
 next = old_entry.next
 prev.next = next
 next.prev = prev

head = self._head
head_prev = self._head.prev
head_next = self._head.next

head.next = new_entry
if head_prev is head:
 head.prev = new_entry
head_next.prev = new_entry
new_entry.prev = head
new_entry.next = head_next

if not old_entry and len(self._dict) > self._max_size:
 last_one = head.prev
 last_one.prev.next = head
 head.prev = last_one.prev
 self._dict.pop(last_one.hash_code)

def __getitem__(self, k):
entry = self._dict[hash(k)]
head = self._head
head_next = head.next
prev = entry.prev
next = entry.next

if entry.prev is not head:
 if head.prev is entry:
 head.prev = prev
 head.next = entry

head_next.prev = entry
 entry.prev = head
 entry.next = head_next

prev.next = next
 next.prev = prev

return entry.v

def get_dict(self):
return self._dict

if __name__ == "__main__":
cache = LRUCache(2)
inner_dict = cache.get_dict()

cache[1] = 1
assert inner_dict.keys() == [1], "test 1"
cache[2] = 2
assert sorted(inner_dict.keys()) == [1, 2], "test 2"
cache[3] = 3
assert sorted(inner_dict.keys()) == [2, 3], "test 3"
cache[2]
assert sorted(inner_dict.keys()) == [2, 3], "test 4"
assert inner_dict[hash(2)].next.v == 3
cache[4] = 4
assert sorted(inner_dict.keys()) == [2, 4], "test 5"
assert inner_dict[hash(4)].v == 4, "test 6"

来源:http://timd.cn/python-lru-cache/

标签:python,lrucache,实现原理
0
投稿

猜你喜欢

  • Python删除字符串中字符的四种方法示例代码

    2021-09-25 08:23:25
  • python Web开发你要理解的WSGI & uwsgi详解

    2021-02-04 08:46:38
  • 关于Flask项目无法使用公网IP访问的解决方式

    2021-01-03 10:04:00
  • Win下PyInstaller 安装和使用教程

    2022-08-14 21:29:53
  • 指定区域的图片自动按比例缩小的js代码(防止页面被图片撑破)

    2024-04-17 10:05:21
  • 深入理解JS中attribute和property的区别

    2024-04-10 16:19:32
  • SQL Server利用sp_spaceused如何查看表记录存在不准确的情况

    2024-01-20 07:40:10
  • python神经网络学习利用PyTorch进行回归运算

    2023-02-24 13:30:47
  • python的即时标记项目练习笔记

    2022-11-25 05:49:35
  • python PIL模块与随机生成中文验证码

    2022-04-19 01:16:46
  • 解析Python扩展模块的加速方案

    2022-12-26 04:53:00
  • Windows10下安装配置 perl 环境的详细教程

    2022-11-17 01:46:32
  • Python利用matplotlib生成图片背景及图例透明的效果

    2023-08-22 08:35:18
  • 将mysql转换到oracle必须了解的50件事

    2010-07-05 12:15:00
  • python opencv实现图像矫正功能

    2022-05-22 17:00:13
  • Python实现将sqlite数据库导出转成Excel(xls)表的方法

    2024-01-18 02:05:10
  • 基于Node.js实现nodemailer邮件发送

    2024-05-03 15:36:40
  • PyHacker实现网站后台扫描器编写指南

    2022-11-07 12:20:24
  • python实现批量修改文件名代码

    2023-05-04 14:44:41
  • Javascript的promise,async和await的区别详解

    2024-04-22 22:43:48
  • asp之家 网络编程 m.aspxhome.com