Python实现json对值进行模糊搜索的示例详解

作者:奥怪的小栈 时间:2023-07-22 09:35:24 

我经常使用json进行存储配置,于是常常遇到这样的问题:如果想要对某个数组里的值进行模糊搜索,同时输出相关的其他数组相同位置的的值该如何实现呢?

思路

代入实际案例来思考一下我的解法

数据

{
   "name": [
       "电饭煲版广式腊肠煲饭",
       "电饭煲烧鸡",
       "电饭煲焖面"],
   "ingredients": [
       "腊肠、米",
       "鸡肉、洋葱、菌菇",
       "猪肉、面食"],
   "url": [
       "https://www.***.com/video/BV1NE411Q7Jj",
       "https://www.***.com/video/BV1T54y1U7Cu",
       "https://www.***.com/video/BV14b411q7rM"
       "https://www.***.com/video/BV1K441157rz"],
   "difficulty": [
       "简单",
       "简单",
       "简单"],
   "tag": [
       "广式",
       "好吃",
       "健康餐"],
   "practice": [
       "炒",
       "烧",
       "蒸"
       ""],
   "tool": [
       "电饭煲",
       "电饭煲",
       "电饭煲"
       ""]
}

这是一个菜谱json。

假如我现在被隔离在家了,手头上只有零星的食材,我想根据手头上的食材来看看我都能做出什么菜。

那么这该如何实现呢?

解法一

假如已知我手上的食物有牛肉、洋葱。那么我可以这样实现

  • 遍历json,然后分别创建数组变量存储name、ingredients、url、difficulty等json数组内容

  • 遍历ingredients数组,模糊匹配是否与我手头上的食物一致

  • 如果一致,将数据加入新的数组中,同时把相同位置的name、url、difficulty等json数组内容也分别加入新的数组中

  • 同时输出各个数组的内容
    显而易见,这种解法太呆了,于是我想还有哪里可以优化呢?

解法二

于是我又想到了另一种写法

  • 只遍历一次json并存储,然后再存储一组需要模糊匹配的内容数组(这个内容数组可以是你想匹配的任何值所在的对应数组,例如想模糊匹配菜名,就只需要存储name数组,想模糊匹配食材,就只需要存储ingredients数组)

  • 模糊匹配是否与我手头上的食物一致并记录下位置

  • 通过位置取其他相关的其他数组相同位置的的值

这个解法的关键在于,因为各个数组的长度相同,所以获取一次位置即可同时知道其他对应数值所在的对应数组中的位置
说的有点绕,直接上代码。

代码实现

首先取菜谱数据

# 取菜谱json
def get_record():
   url = "./menu.json"
   if not os.path.isfile(url):
       return "菜谱获取失败"
   fo = open(url, "r", encoding='utf-8')
   ele_json = loads(fo.read())
   return ele_json

模糊搜索实现

# 模糊搜索
def fuzzyfinder(user_input, collection_key_list):
   suggestions = []
   pattern = '.*?'.join(user_input)  # Converts 'djm' to 'd.*?j.*?m'
   regex = compile(pattern)  # Compiles a regex.
   a = 0
   for item in collection_key_list:
       match = regex.search(item)  # Checks if the current item matches the regex.
       if match:
           suggestions.append(a)
       a = a + 1
   return suggestions

user_input 和 collection_key_list 分别表示 关键字 和 欲模糊匹配的数组suggestions数组 存储了模糊匹配上了的数值的位置

最后根据实际情况进行数据取出使用即可。

在本例子里,就是取出菜谱

def get_cook(key):
   # 进一步解析资源json
   al_dict = get_record()
   collection_key = []  # 用来模糊匹配的key
   for b in al_dict['ingredients']:
       collection_key.append(b)
   fuzzyfinder_i_list = fuzzyfinder(key, collection_key)  # 模糊搜索资源
   fuzzyfinder_i_len = len(fuzzyfinder_i_list)
   if fuzzyfinder_i_len > 0:
       if collection_key[fuzzyfinder_i_list[0]].replace("、", "") == key.replace("、", ""):
           return "".join([al_dict['name'][fuzzyfinder_i_list[0]], "丨", al_dict['ingredients'][fuzzyfinder_i_list[0]],
                           "\nB站教程BV号:", al_dict['url'][fuzzyfinder_i_list[0]], "\n难度:",
                           al_dict['difficulty'][fuzzyfinder_i_list[0]], "丨标签:", al_dict['tag'][fuzzyfinder_i_list[0]],
                           "\n方法:", al_dict['practice'][fuzzyfinder_i_list[0]], "丨工具:",
                           al_dict['tool'][fuzzyfinder_i_list[0]]])
       elif collection_key[fuzzyfinder_i_list[fuzzyfinder_i_len - 1]].replace("、", "") == key.replace("、", ""):
           return "".join([al_dict['name'][fuzzyfinder_i_list[fuzzyfinder_i_len - 1]], "丨",
                           al_dict['ingredients'][fuzzyfinder_i_list[fuzzyfinder_i_len - 1]],
                           "\nB站教程BV号:", al_dict['url'][fuzzyfinder_i_list[fuzzyfinder_i_len - 1]], "\n难度:",
                           al_dict['difficulty'][fuzzyfinder_i_list[fuzzyfinder_i_len - 1]], "丨标签:",
                           al_dict['tag'][fuzzyfinder_i_list[fuzzyfinder_i_len - 1]],
                           "\n方法:", al_dict['practice'][fuzzyfinder_i_list[fuzzyfinder_i_len - 1]], "丨工具:",
                           al_dict['tool'][fuzzyfinder_i_list[fuzzyfinder_i_len - 1]]])
       else:
           re_text = "未找到精准关键词,模糊搜索到以下内容:\n"
           for c in fuzzyfinder_i_list:
               re_text = "".join(
                   [re_text, al_dict['name'][c], "丨", al_dict['ingredients'][c], "\nB站教程BV号:",
                    al_dict['url'][c], "\n难度:", al_dict['difficulty'][c],
                    "丨标签:", al_dict['tag'][c], "\n方法:", al_dict['practice'][c],
                    "丨工具:", al_dict['tool'][c], "\n"])

return re_text
   else:
       content = "".join(["未找到" + key + "相关菜谱"])
       return content

这个写法可以同时解决精准匹配和模糊匹配问题,精准匹配结果一般是数组第一个或最后一个,所以只需要判断一下首尾是否与关键字相同即可

结果

来看一下效果

精准匹配

if __name__ == "__main__":
   print(get_cook("胡萝卜、牛肉、洋葱"))
>>>胡萝卜炖牛肉丨胡萝卜、牛肉、洋葱
>>>B站教程BV号:https://www.***.com/video/BV1UR4y1V7nV
>>>难度:困难丨标签:法式
>>>方法:炖丨工具:一口大锅

模糊匹配

if __name__ == "__main__":
   print(get_cook("牛肉、洋葱"))
>>>未找到精准关键词,模糊搜索到以下内容:
>>>电饭煲罗宋汤丨牛肉、番茄、洋葱、芹菜、胡萝卜、土豆、卷心菜
>>>B站教程BV号:https://www.***.com/video/BV16Q4y1m7nU
>>>难度:简单丨标签:杂烩
>>>方法:丨工具:电饭煲
>>>胡萝卜炖牛肉丨胡萝卜、牛肉、洋葱
>>>B站教程BV号:https://www.***.com/video/BV1UR4y1V7nV
>>>难度:困难丨标签:法式
>>>...

问题解决

来源:https://segmentfault.com/a/1190000041722447

标签:Python,json,值,模糊,搜索
0
投稿

猜你喜欢

  • 详细解读Python中的json操作

    2022-02-21 00:55:13
  • 在Laravel 中实现是否关注的示例

    2023-11-14 15:22:57
  • sqlserver 多表查询不同数据库服务器上的表

    2024-01-15 04:56:24
  • 教你利用python如何读取txt中的数据

    2023-04-03 14:52:36
  • Oracle In和exists not in和not exists的比较分析

    2009-08-27 10:07:00
  • MySQL常用分库分表方案汇总

    2024-01-18 10:51:14
  • php+highchats生成动态统计图

    2024-05-02 17:19:08
  • windows7下mysql8.0.18部署安装教程图解

    2024-01-22 04:20:20
  • Python基础语法之容器详解

    2022-01-07 23:20:19
  • SQL Server创建索引教程

    2010-07-02 21:09:00
  • Python的Django框架中消息通知的计数器实现教程

    2021-03-22 04:13:43
  • Python txt文件常用读写操作代码实例

    2021-08-22 04:38:28
  • vue圆环百分比进度条组件功能的实现

    2024-06-07 15:19:57
  • MySQL脏读幻读不可重复读及事务的隔离级别和MVCC、LBCC实现

    2024-01-19 00:23:03
  • 详解小白之KMP算法及python实现

    2022-08-29 09:09:17
  • 使用git处理github中提交有冲突的pull request的问题

    2023-03-18 13:27:55
  • SQL2000 事务回滚问题探讨

    2024-01-26 19:58:37
  • 深入分析JavaScript 事件循环(Event Loop)

    2024-04-18 10:51:52
  • ASP 包含文件中的路径问题和使用单一数据库连接文件的解决方案

    2011-04-07 10:35:00
  • Python matplotlib包和gif包生成gif动画实战对比

    2022-08-09 14:09:45
  • asp之家 网络编程 m.aspxhome.com