python使用KNN算法手写体识别
作者:一笑丶奈何 时间:2022-06-28 05:30:56
本文实例为大家分享了用KNN算法手写体识别的具体代码,供大家参考,具体内容如下
#!/usr/bin/python
#coding:utf-8
import numpy as np
import operator
import matplotlib
import matplotlib.pyplot as plt
import os
'''''
KNN算法
1. 计算已知类别数据集中的每个点依次执行与当前点的距离。
2. 按照距离递增排序。
3. 选取与当前点距离最小的k个点
4. 确定前k个点所在类别的出现频率
5. 返回前k个点出现频率最高的类别作为当前点的预测分类
'''
'''''
inX为要分类的向量
dataSet为训练样本
labels为标签向量
k为最近邻的个数
'''
def classify0(inX , dataSet , labels , k):
dataSetSize = dataSet.shape[0]#dataSetSize为训练样本的个数
diffMat = np.tile(inX , (dataSetSize , 1)) - dataSet#将inX扩展为dataSetSize行,1列
sqDiffMat = diffMat**2
sqDistances = sqDiffMat.sum(axis=1)
distances = sqDistances**0.5
sortedDistIndicies = distances.argsort()#返回的是元素从小到大排序后,该元素原来的索引值的序列
classCount = {}
for i in range(k):
voteIlabel = labels[sortedDistIndicies[i]]#voteIlabel为类别
classCount[voteIlabel] = classCount.get(voteIlabel,0)+1#如果之前这个voteIlabel是有的,那么就返回字典里这个voteIlabel里的值,如果没有就返回0
sortedClassCount = sorted(classCount.iteritems(),key=operator.itemgetter(1),reverse=True)#key=operator.itemgetter(1)的意思是按照字典里的第一个排序,{A:1,B:2},要按照第1个(AB是第0个),即‘1'‘2'排序。reverse=True是降序排序
print sortedClassCount
return sortedClassCount[0][0]
'''''
将图像转换为1*1024的向量
'''
def img2vector(filename):
returnVect = np.zeros((1,1024))
fr = open(filename)
for i in range(32):
line = fr.readline()
for j in range(32):
returnVect[0,i*32+j] = int(line[j] )
return returnVect
'''''
手写体识别系统测试
'''
def handwritingClassTest(trainFilePath,testFilePath):
hwLabels = []
trainingFileList = os.listdir(trainFilePath)
m=len(trainingFileList)
trainSet = np.zeros((m,1024))
for i in range(m):
filename = trainingFileList[i]
classNum = filename.split('.')[0]
classNum = int(classNum.split('_')[0])
hwLabels.append(classNum)
trainSet[i] = img2vector( os.path.join(trainFilePath,filename) )
testFileList = os.listdir(testFilePath)
errorCount = 0
mTest = len(testFileList)
for i in range(mTest):
filename = trainingFileList[i]
classNum = filename.split('.')[0]
classNum = int(classNum.split('_')[0])
vectorUnderTest = img2vector(os.path.join(trainFilePath, filename))
classifyNum = classify0(vectorUnderTest,trainSet,hwLabels,10)
print "the classifier came back with : %d , the real answer is : %d"% (classifyNum , classNum)
if(classifyNum != classNum) : errorCount+=1
print ("\nthe total number of error is : %d"%errorCount)
print ("\nthe error rate is : %f"%(float(errorCount)/mTest))
handwritingClassTest()
来源:https://www.cnblogs.com/Lambda721/p/8397453.html
标签:python,KNN,识别
0
投稿
猜你喜欢
陌生网页交互行为分析(1)——奇怪的关闭按钮
2009-01-08 12:22:00
ORACLE8的分区管理
2023-07-13 14:42:43
在Python中操作时间之mktime()方法的使用教程
2023-02-07 11:38:58
Python装饰器用法实例总结
2023-11-18 07:37:36
ASP使用xmlhttp调用WEBSERVICE文档
2008-05-30 13:56:00
一文详解Python中logging模块的用法
2022-03-27 23:09:38
基于PHP选项与信息函数的使用详解
2024-05-13 09:23:34
Git工作流演示及三种工作方式
2023-09-12 20:23:05
MySQL中KEY、PRIMARY KEY、UNIQUE KEY、INDEX 的区别
2024-01-16 00:47:29
利用ThinkPHP内置的ThinkAjax实现异步传输技术的实现方法
2023-09-11 15:11:50
MySQL索引之主键索引
2024-01-25 01:52:04
Go 语言 IDE 中的 VSCode 配置使用教程
2024-02-20 23:27:36
Python真题案例之错位键盘 单词长度 字母重排详解
2023-03-18 02:57:26
Python集成学习之Blending算法详解
2022-09-28 04:31:35
Python字符串str超详细详解(适合新手!)
2021-06-26 02:48:00
详解Vue 事件驱动和依赖追踪
2024-04-10 10:32:10
史上最简单的MySQL数据备份与还原教程(下)(三十七)
2024-01-25 06:03:33
Python3爬虫RedisDump的安装步骤
2023-07-17 00:42:15
如何优化SQL语句(全)
2024-01-27 06:12:59
用Dreamweaver实现Real与网页结合
2010-07-13 12:11:00