Python实现json对值进行模糊搜索的示例详解
作者:奥怪的小栈 时间:2023-07-22 09:35:24
我经常使用json进行存储配置,于是常常遇到这样的问题:如果想要对某个数组里的值进行模糊搜索,同时输出相关的其他数组相同位置的的值该如何实现呢?
思路
代入实际案例来思考一下我的解法
数据
{
"name": [
"电饭煲版广式腊肠煲饭",
"电饭煲烧鸡",
"电饭煲焖面"],
"ingredients": [
"腊肠、米",
"鸡肉、洋葱、菌菇",
"猪肉、面食"],
"url": [
"https://www.***.com/video/BV1NE411Q7Jj",
"https://www.***.com/video/BV1T54y1U7Cu",
"https://www.***.com/video/BV14b411q7rM"
"https://www.***.com/video/BV1K441157rz"],
"difficulty": [
"简单",
"简单",
"简单"],
"tag": [
"广式",
"好吃",
"健康餐"],
"practice": [
"炒",
"烧",
"蒸"
""],
"tool": [
"电饭煲",
"电饭煲",
"电饭煲"
""]
}
这是一个菜谱json。
假如我现在被隔离在家了,手头上只有零星的食材,我想根据手头上的食材来看看我都能做出什么菜。
那么这该如何实现呢?
解法一
假如已知我手上的食物有牛肉、洋葱。那么我可以这样实现
遍历json,然后分别创建数组变量存储name、ingredients、url、difficulty等json数组内容
遍历ingredients数组,模糊匹配是否与我手头上的食物一致
如果一致,将数据加入新的数组中,同时把相同位置的name、url、difficulty等json数组内容也分别加入新的数组中
同时输出各个数组的内容
显而易见,这种解法太呆了,于是我想还有哪里可以优化呢?
解法二
于是我又想到了另一种写法
只遍历一次json并存储,然后再存储一组需要模糊匹配的内容数组(这个内容数组可以是你想匹配的任何值所在的对应数组,例如想模糊匹配菜名,就只需要存储name数组,想模糊匹配食材,就只需要存储ingredients数组)
模糊匹配是否与我手头上的食物一致并记录下位置
通过位置取其他相关的其他数组相同位置的的值
这个解法的关键在于,因为各个数组的长度相同,所以获取一次位置即可同时知道其他对应数值所在的对应数组中的位置
说的有点绕,直接上代码。
代码实现
首先取菜谱数据
# 取菜谱json
def get_record():
url = "./menu.json"
if not os.path.isfile(url):
return "菜谱获取失败"
fo = open(url, "r", encoding='utf-8')
ele_json = loads(fo.read())
return ele_json
模糊搜索实现
# 模糊搜索
def fuzzyfinder(user_input, collection_key_list):
suggestions = []
pattern = '.*?'.join(user_input) # Converts 'djm' to 'd.*?j.*?m'
regex = compile(pattern) # Compiles a regex.
a = 0
for item in collection_key_list:
match = regex.search(item) # Checks if the current item matches the regex.
if match:
suggestions.append(a)
a = a + 1
return suggestions
user_input 和 collection_key_list 分别表示 关键字 和 欲模糊匹配的数组suggestions数组 存储了模糊匹配上了的数值的位置
最后根据实际情况进行数据取出使用即可。
在本例子里,就是取出菜谱
def get_cook(key):
# 进一步解析资源json
al_dict = get_record()
collection_key = [] # 用来模糊匹配的key
for b in al_dict['ingredients']:
collection_key.append(b)
fuzzyfinder_i_list = fuzzyfinder(key, collection_key) # 模糊搜索资源
fuzzyfinder_i_len = len(fuzzyfinder_i_list)
if fuzzyfinder_i_len > 0:
if collection_key[fuzzyfinder_i_list[0]].replace("、", "") == key.replace("、", ""):
return "".join([al_dict['name'][fuzzyfinder_i_list[0]], "丨", al_dict['ingredients'][fuzzyfinder_i_list[0]],
"\nB站教程BV号:", al_dict['url'][fuzzyfinder_i_list[0]], "\n难度:",
al_dict['difficulty'][fuzzyfinder_i_list[0]], "丨标签:", al_dict['tag'][fuzzyfinder_i_list[0]],
"\n方法:", al_dict['practice'][fuzzyfinder_i_list[0]], "丨工具:",
al_dict['tool'][fuzzyfinder_i_list[0]]])
elif collection_key[fuzzyfinder_i_list[fuzzyfinder_i_len - 1]].replace("、", "") == key.replace("、", ""):
return "".join([al_dict['name'][fuzzyfinder_i_list[fuzzyfinder_i_len - 1]], "丨",
al_dict['ingredients'][fuzzyfinder_i_list[fuzzyfinder_i_len - 1]],
"\nB站教程BV号:", al_dict['url'][fuzzyfinder_i_list[fuzzyfinder_i_len - 1]], "\n难度:",
al_dict['difficulty'][fuzzyfinder_i_list[fuzzyfinder_i_len - 1]], "丨标签:",
al_dict['tag'][fuzzyfinder_i_list[fuzzyfinder_i_len - 1]],
"\n方法:", al_dict['practice'][fuzzyfinder_i_list[fuzzyfinder_i_len - 1]], "丨工具:",
al_dict['tool'][fuzzyfinder_i_list[fuzzyfinder_i_len - 1]]])
else:
re_text = "未找到精准关键词,模糊搜索到以下内容:\n"
for c in fuzzyfinder_i_list:
re_text = "".join(
[re_text, al_dict['name'][c], "丨", al_dict['ingredients'][c], "\nB站教程BV号:",
al_dict['url'][c], "\n难度:", al_dict['difficulty'][c],
"丨标签:", al_dict['tag'][c], "\n方法:", al_dict['practice'][c],
"丨工具:", al_dict['tool'][c], "\n"])
return re_text
else:
content = "".join(["未找到" + key + "相关菜谱"])
return content
这个写法可以同时解决精准匹配和模糊匹配问题,精准匹配结果一般是数组第一个或最后一个,所以只需要判断一下首尾是否与关键字相同即可
结果
来看一下效果
精准匹配
if __name__ == "__main__":
print(get_cook("胡萝卜、牛肉、洋葱"))
>>>胡萝卜炖牛肉丨胡萝卜、牛肉、洋葱
>>>B站教程BV号:https://www.***.com/video/BV1UR4y1V7nV
>>>难度:困难丨标签:法式
>>>方法:炖丨工具:一口大锅
模糊匹配
if __name__ == "__main__":
print(get_cook("牛肉、洋葱"))
>>>未找到精准关键词,模糊搜索到以下内容:
>>>电饭煲罗宋汤丨牛肉、番茄、洋葱、芹菜、胡萝卜、土豆、卷心菜
>>>B站教程BV号:https://www.***.com/video/BV16Q4y1m7nU
>>>难度:简单丨标签:杂烩
>>>方法:丨工具:电饭煲
>>>胡萝卜炖牛肉丨胡萝卜、牛肉、洋葱
>>>B站教程BV号:https://www.***.com/video/BV1UR4y1V7nV
>>>难度:困难丨标签:法式
>>>...
问题解决
来源:https://segmentfault.com/a/1190000041722447