Keras预训练的ImageNet模型实现分类操作
作者:cchangcs 公众号: hw_cch 时间:2021-12-14 01:33:11
本文主要介绍通过预训练的ImageNet模型实现图像分类,主要使用到的网络结构有:VGG16、InceptionV3、ResNet50、MobileNet。
代码:
import keras
import numpy as np
from keras.applications import vgg16, inception_v3, resnet50, mobilenet
# 加载模型
vgg_model = vgg16.VGG16(weights='imagenet')
inception_model = inception_v3.InceptionV3(weights='imagenet')
resnet_model = resnet50.ResNet50(weights='imagenet')
mobilenet_model = mobilenet.MobileNet(weights='imagenet')
# 导入所需的图像预处理模块
from keras.preprocessing.image import load_img
from keras.preprocessing.image import img_to_array
from keras.applications.imagenet_utils import decode_predictions
import matplotlib.pyplot as plt
%matplotlib inline
filename= 'images/cat.jpg'
# 将图片输入到网络之前执行预处理
'''
1、加载图像,load_img
2、将图像从PIL格式转换为Numpy格式,image_to_array
3、将图像形成批次,Numpy的expand_dims
'''
# 以PIL格式加载图像
original = load_img(filename, target_size=(224, 224))
print('PIL image size', original.size)
plt.imshow(original)
plt.show()
# 将输入图像从PIL格式转换为Numpy格式
# In PIL-- 图像为(width, height, channel)
# In Numpy——图像为(height, width, channel)
numpy_image = img_to_array(original)
plt.imshow(np.uint8(numpy_image))
plt.show()
print('numpy array size', numpy_image.size)
# 将图像/图像转换为批量格式
# expand_dims将为特定轴上的数据添加额外的维度
# 网络的输入矩阵具有形式(批量大小,高度,宽度,通道)
# 因此,将额外的维度添加到轴0。
image_batch = np.expand_dims(numpy_image, axis=0)
print('image batch size', image_batch.shape)
plt.imshow(np.uint8(image_batch[0]))
# 使用各种网络进行预测
# 通过从批处理中的图像的每个通道中减去平均值来预处理输入。
# 平均值是通过从ImageNet获得的所有图像的R,G,B像素的平均值获得的三个元素的阵列
# 获得每个类的发生概率
# 将概率转换为人类可读的标签
# VGG16 网络模型
# 对输入到VGG模型的图像进行预处理
processed_image = vgg16.preprocess_input(image_batch.copy())
# 获取预测得到的属于各个类别的概率
predictions = vgg_model.predict(processed_image)
# 输出预测值
# 将预测概率转换为类别标签
# 缺省情况下将得到最有可能的五种类别
label_vgg = decode_predictions(predictions)
label_vgg
# ResNet50网络模型
# 对输入到ResNet50模型的图像进行预处理
processed_image = resnet50.preprocess_input(image_batch.copy())
# 获取预测得到的属于各个类别的概率
predictions = resnet_model.predict(processed_image)
# 将概率转换为类标签
# 如果要查看前3个预测,可以使用top参数指定它
label_resnet = decode_predictions(predictions, top=3)
label_resnet
# MobileNet网络结构
# 对输入到MobileNet模型的图像进行预处理
processed_image = mobilenet.preprocess_input(image_batch.copy())
# 获取预测得到属于各个类别的概率
predictions = mobilenet_model.predict(processed_image)
# 将概率转换为类标签
label_mobilnet = decode_predictions(predictions)
label_mobilnet
# InceptionV3网络结构
# 初始网络的输入大小与其他网络不同。 它接受大小的输入(299,299)。
# 因此,根据它加载具有目标尺寸的图像。
# 加载图像为PIL格式
original = load_img(filename, target_size=(299, 299))
# 将PIL格式的图像转换为Numpy数组
numpy_image = img_to_array(original)
# 根据批量大小重塑数据
image_batch = np.expand_dims(numpy_image, axis=0)
# 将输入图像转换为InceptionV3所能接受的格式
processed_image = inception_v3.preprocess_input(image_batch.copy())
# 获取预测得到的属于各个类别的概率
predictions = inception_model.predict(processed_image)
# 将概率转换为类标签
label_inception = decode_predictions(predictions)
label_inception
import cv2
numpy_image = np.uint8(img_to_array(original)).copy()
numpy_image = cv2.resize(numpy_image,(900,900))
cv2.putText(numpy_image, "VGG16: {}, {:.2f}".format(label_vgg[0][0][1], label_vgg[0][0][2]) , (350, 40), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 0, 0), 3)
cv2.putText(numpy_image, "MobileNet: {}, {:.2f}".format(label_mobilenet[0][0][1], label_mobilenet[0][0][2]) , (350, 75), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 0, 0), 3)
cv2.putText(numpy_image, "Inception: {}, {:.2f}".format(label_inception[0][0][1], label_inception[0][0][2]) , (350, 110), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 0, 0), 3)
cv2.putText(numpy_image, "ResNet50: {}, {:.2f}".format(label_resnet[0][0][1], label_resnet[0][0][2]) , (350, 145), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 0, 0), 3)
numpy_image = cv2.resize(numpy_image, (700,700))
cv2.imwrite("images/{}_output.jpg".format(filename.split('/')[-1].split('.')[0]),cv2.cvtColor(numpy_image, cv2.COLOR_RGB2BGR))
plt.figure(figsize=[10,10])
plt.imshow(numpy_image)
plt.axis('off')
训练数据:
运行结果:
来源:https://blog.csdn.net/github_39611196/article/details/88016880
标签:Keras,预训练,ImageNet,分类
0
投稿
猜你喜欢
浅谈解除装饰器作用(python3新增)
2022-05-30 03:31:52
python3实现全角和半角字符转换的方法示例
2021-06-16 13:08:36
实例解析:MySQL 实例管理器识别的命令
2009-02-23 17:33:00
python实现按任意键继续执行程序
2021-02-12 12:47:10
运维角度浅谈MySQL数据库优化(李振良)
2024-01-22 17:27:01
Python编程中字符串和列表的基本知识讲解
2022-02-19 16:39:25
python pyheatmap包绘制热力图
2021-02-18 21:35:46
document.getElementById的简写方式
2010-06-21 10:44:00
ASP编程中使用数组方法实例讲解
2008-02-15 08:25:00
Pytest测试报告工具Allure的高级用法
2023-06-20 17:21:09
python TCP Socket的粘包和分包的处理详解
2021-06-14 16:49:50
如何添加一个mysql用户并给予权限详解
2024-01-17 06:09:36
python GUI编程(Tkinter) 创建子窗口及在窗口上用图片绘图实例
2021-12-21 19:37:29
在element-ui的select下拉框加上滚动加载
2024-04-17 10:04:14
在ASP.NET 2.0中操作数据之三十六:在DataList里编辑和删除数据概述
2024-05-09 09:03:43
Python简单格式化时间的方法【strftime函数】
2023-03-29 11:30:16
使用javascript修复浏览器中12个常见而又头痛的问题
2008-10-28 19:38:00
Python 如何实现访问者模式
2021-08-10 20:49:53
CentOS6.5设置Django开发环境
2022-09-29 22:55:30
分析Python感知线程状态的解决方案之Event与信号量
2022-05-11 07:23:35