java写卷积神经网络(CupCnn简介)

作者:阳光玻璃杯 时间:2022-12-11 09:33:09 

前言

在机器学习中,卷积神经网络是一种深度前馈人工神经网络,已成功地应用于图像识别。目前,很多的车牌识号识别,人脸识别等都采用卷积神经网络,可以说卷积神经网络在图像识别方面取得了巨大的成功。当前开源的深度学习框架有很多了,比如caffe,tensorflow,torch等,这些深度学习框架包含了完善的卷积神经网络的实现,那么,为什么我们还要自己写卷积神经网络?直接用这些开源的深度学习框架多好,又快又省事,性能好稳定,bug少。是的,如果你只是使用卷积神经网络做一些应用,并不在意它的工作原理,那你大可不必自己费神费力的写卷积神经网络,可如果你想完全掌握卷积神经网络的工作原理,古人云:纸上得来终觉浅,觉知此时要躬行。所以,你很有必要自己实现一遍卷积神经网络,从而加深对它的认识。

什么是CupCnn

CupCnn是个用java写的卷积神经网络,我在工作之余,为了加深对卷积神经网络的认识,实现了它。它足够简洁,表现也不错,非常适合初学者参考使用。它的源码可以从github下载:CupCnn

你不用担心它的协议什么的限制,您可以用它来做任何事,任意修改它,如果它能对你有所帮助,希望能给个星星!!!
^-^^-^^-^

设计的思路

我希望它是以足够简单的神经网络,这样有利于初学者学习。所以我没有实现那些并发加速的东西,这保证的代码的简介性。设计的时候,我将卷积神经网络分为四个模块:Network(layer blob loss active),这点可以从包名中看出来。layer,loss,active都有一个基类,整个神经网络的编程都是面向基类的。Network是综合这四个模块,统筹和调度资源的中心,每个layer都会有一个Network的实例,这样可以轻松的通过Network获得各种数据,比如获取每一层的输出,diff等。
设计框图如下:

java写卷积神经网络(CupCnn简介)

参数的保存对于java而言就非常简单了,实现Serializable接口就可以快速实现参数的序列化和反序列化。CupCnn只对data目录下的Blob和BlobParams两个实现了Serializable接口,所有的参数都由这两个实现。

目前的表现

全连接神经网络

目前,在mnist数据集上,全连接神经网络(全连接(100)+全连接(30)+全连接(10)+softmax),训练30个epoes,准确率为96.76

卷积神经网络

卷积神经网络(6个特征)+最大值池化+卷积(6个特征)+全连接(512)+全连接(30)+全连接(10)+softmax),在学习速率为0.2的情况下,训练30个epoes,准确率为97.79.我相信经过进一步参数调优,在充分训练的情况下,准确率能达到更高。

卷积神经网络训练快照如下:

begin train
epoe: 0 lossValue: 2.3019369891560455   lr: 0.2  accuracy is 0.13
epoe: 0 lossValue: 2.0722489482105195   lr: 0.2  accuracy is 0.44
epoe: 0 lossValue: 1.2423286194012682   lr: 0.2  accuracy is 0.72
epoe: 0 lossValue: 0.7860529560675255   lr: 0.2  accuracy is 0.79
epoe: 0 lossValue: 0.6272194196176664   lr: 0.2  accuracy is 0.87
epoe: 0 lossValue: 0.5240051326725808   lr: 0.2  accuracy is 0.84
epoe: 0 lossValue: 0.27637563581928026   lr: 0.2  accuracy is 0.95
epoe: 0 lossValue: 0.35585388987055083   lr: 0.2  accuracy is 0.92
epoe: 0 lossValue: 0.441971528417802   lr: 0.2  accuracy is 0.92
epoe: 0 lossValue: 0.25637710325999674   lr: 0.2  accuracy is 0.95
epoe: 0 lossValue: 0.39872273532502   lr: 0.2  accuracy is 0.9
epoe: 1 lossValue: 0.264085484522027   lr: 0.16000000000000003  accuracy is 0.91
epoe: 1 lossValue: 0.22754066024803088   lr: 0.16000000000000003  accuracy is 0.96
epoe: 1 lossValue: 0.30256420975577103   lr: 0.16000000000000003  accuracy is 0.96
epoe: 1 lossValue: 0.18149648622985948   lr: 0.16000000000000003  accuracy is 0.99
epoe: 1 lossValue: 0.177239938748327   lr: 0.16000000000000003  accuracy is 0.96
epoe: 1 lossValue: 0.15041993009777443   lr: 0.16000000000000003  accuracy is 0.98
epoe: 1 lossValue: 0.10759545752665524   lr: 0.16000000000000003  accuracy is 1.0

CupCnn的使用

目前,CupCnn实现了mnist数据集上的测试,在src/test下,MnistTest是main函数的入口,具体的神经网络的搭建在MnistNetwork类中。在MnistNetwork类中,buildConvNetwork和buildFcNetwork分别实现
了搭建卷积神经网络和搭建全连接神经网络。得益于java良好的跨平台属性,你下载完CupCnn的源码后,使用eclipse打开该项目,然后直接运行,应该就能开始在mnist数据集上训练和测试了。

构建神经网络


 public void buildNetwork(){
   //首先构建神经网络对象,并设置参数
   network = new Network();
   network.setBatch(100);
   network.setLoss(new LogLikeHoodLoss());
   //network.setLoss(new CrossEntropyLoss());
   optimizer = new SGDOptimizer(0.2);
   network.setOptimizer(optimizer);

//buildFcNetwork();
   buildConvNetwork();

network.prepare();
 }

setBatch()函数设置一个批次里有多少张图片。

setLoss()设置要是用的损失函数。CupCnn实现了交叉熵损失函数和对数似然损失函数。

setOptimizer()设置要是用的优化器。CupCnn只实现了SGD优化器,如果您实现了更好的优化器,并且愿意提交到CupCnn,那本人深表欢迎。

构建全连接神经网络


 private void buildFcNetwork(){
   //给network添加网络层
   InputLayer layer1 = new InputLayer(network,new BlobParams(network.getBatch(),1,28,28));
   network.addLayer(layer1);
   FullConnectionLayer layer2 = new FullConnectionLayer(network,new BlobParams(network.getBatch(),784,1,1));
   layer2.setActivationFunc(new ReluActivationFunc());
   network.addLayer(layer2);
   FullConnectionLayer layer3 = new FullConnectionLayer(network,new BlobParams(network.getBatch(),100,1,1));
   layer3.setActivationFunc(new ReluActivationFunc());
   network.addLayer(layer3);
   FullConnectionLayer layer4 = new FullConnectionLayer(network,new BlobParams(network.getBatch(),30,1,1));
   layer4.setActivationFunc(new SigmodActivationFunc());
   network.addLayer(layer4);
   FullConnectionLayer layer5 = new FullConnectionLayer(network,new BlobParams(network.getBatch(),10,1,1));
   layer5.setActivationFunc(new ReluActivationFunc());
   network.addLayer(layer5);
   SoftMaxLayer sflayer = new SoftMaxLayer(network,new BlobParams(network.getBatch(),10,1,1));
   network.addLayer(sflayer);
 }

正如上面代码展示的一样,每一个Layer都需要一个network,它是Network的实例,Network是全局的管理者和资源的调度者,有了Network的引用,我们可以轻易的获得到每一层的输出的数据,输出的误差等。此外,每一层都需要一个指定当前层输出数据块大小的参数,该参数告诉某一层你需要输出多少数据。比如神经网络的最后一层是SoftMaxLayer ,它需要输出到底是哪个数字,这个数字用长度为10的向量表示,比如数字7,那么SoftMaxLayer 应该输出第8个元素的值为1,其他元素的值为0。卷积层和池化层需要更多的参数,因为他们都有一个kernel,对卷积层而言,它叫卷积核,卷积层的实现每此每个方向的stride也就是步长都是1,这点还有改进的余地。对于池化层,你出来需要传入池化核的参数外,还需要传入水平方向和垂直方向的步长,这是必须的。

训练和测试

搭建好神经网络后,你需要调用network.prepare()方法,该方法会根据每一层的数据参数创建输出数据块和误差数据块。因此该方法的调用是必须的。


 public void train(List<DigitImage> imgList,int epoes){
   System.out.println("begin train");
   int batch = network.getBatch();
   double loclaLr = optimizer.getLr();
   for(int e=0;e<epoes;e++){
     Collections.shuffle(imgList);
     for(int i=0;i<imgList.size()-batch;i+=batch){
       List<Blob> inputAndLabel = buildBlobByImageList(imgList,i,batch,1,28,28);
       double lossValue = network.train(inputAndLabel.get(0), inputAndLabel.get(1));

if(i>batch && i/batch%50==0){
         System.out.print("epoe: "+e+" lossValue: "+lossValue+" "+" lr: "+optimizer.getLr()+" ");
         testInner(inputAndLabel.get(0), inputAndLabel.get(1));
       }
     }

if(loclaLr>0.001){
       loclaLr*=0.8;
       optimizer.setLr(loclaLr);
     }
   }
 }

public void test(List<DigitImage> imgList){
   System.out.println("begin test");
   int batch = network.getBatch();
   int correctCount = 0;
   int i = 0;
   for(i=0;i<imgList.size()-batch;i+=batch){
     List<Blob> inputAndLabel = buildBlobByImageList(imgList,i,batch,1,28,28);
     Blob output = network.predict(inputAndLabel.get(0));
     int[] calOutLabels = getBatchOutputLabel(output.getData());
     int[] realLabels = getBatchOutputLabel(inputAndLabel.get(1).getData());
     for(int kk=0;kk<calOutLabels.length;kk++){
       if(calOutLabels[kk] == realLabels[kk]){
         correctCount++;
       }
     }
   }

double accuracy = correctCount/(1.0*i+batch);
   System.out.println("test accuracy is "+accuracy+" correctCount "+correctCount);
 }

 如上,调用Network的 train即可训练,调用Network的predict方法即可测试。

参数的保存和加载


 public void saveModel(String name){
   network.saveModel(name);
 }

public void loadModel(String name){
   network = new Network();
   network.loadModel(name);
   network.prepare();
 }

调用Network的saveModel和loadModel可分别实现参数的保存和加载,你只需要传入一个文件名即可。当我们通过保存的参数创建神经网络的时候,我们需要先new 一个Network,然后调用这个network的loadModel加载已保存的参数,然后不要忘记调用prepare方法创建每一层的输出数据块和误差数据块。

目前的完成情况及未来的计划

目前,实现的层有:全连接,卷积,最大值池化层,平均值池化层,softmax层。实现的激活函数有:sigmod,tanh,relu.
实现的损失函数有:交叉熵,对数似然。实现的优化为:SGD。参数已经能save和load.接下来会添加droupout层,还会尝试添加cifar-10上的例子。

此外,我会写一些文章,回顾自己写CupCnn过程中的思考可问题,供初学者参考,大神请绕道。感兴趣的可以继续关注,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

来源:https://blog.csdn.net/u011913612/article/details/79253450

标签:java,卷积神经网络
0
投稿

猜你喜欢

  • spring boot实战教程之shiro session过期时间详解

    2023-01-05 01:37:47
  • java使用POI操作excel文件

    2023-05-17 00:37:12
  • java文件下载代码实例(单文件下载和多文件打包下载)

    2023-02-16 00:38:37
  • java实现Dijkstra算法

    2021-09-02 23:14:15
  • C语言之如何求三次方根

    2022-04-30 03:13:52
  • 如何正确使用Android线程详解

    2021-12-06 19:24:30
  • C# 调用WebService的方法

    2022-03-19 12:42:37
  • 图文浅析Java序列化和反序列化

    2022-08-03 17:46:59
  • IntelliJ IDEA 2017 汉化包及图文教程

    2023-11-25 12:17:58
  • Java实现冒泡排序算法

    2023-07-13 03:02:28
  • 搭建简单的Spring-Data JPA项目

    2023-04-05 01:06:30
  • 基于C#对用户密码使用MD5加密与解密

    2022-11-24 23:05:23
  • 详解DES&3DES算法的原理以及C#和JS的实现

    2021-06-29 21:58:07
  • C#获取文件创建时间的方法

    2022-04-25 22:56:55
  • Java编程Socket实现多个客户端连接同一个服务端代码

    2023-12-27 05:32:11
  • Java数据结构之图的路径查找算法详解

    2023-03-27 03:47:11
  • java启动jar包将日志打印到文本的简单操作

    2021-12-05 10:42:21
  • Spring初始化与销毁顺序案例演示详解

    2021-06-08 14:33:10
  • c语言中static修饰函数的方法及代码

    2023-08-26 15:46:21
  • 使用eclipse创建java项目的方法

    2022-10-15 04:41:00
  • asp之家 软件编程 m.aspxhome.com