下载此文档

基于神经网络的古钱币图像检索研究.doc

文档分类：IT计算机 | 页数：约6页举报非法文档有奖

1/6

下载提示

1.该资料是网友上传的，本站提供全文预览，预览什么样，下载就什么样。
2.下载该文档所得收入归上传者、原创者。
3.下载的文档，不会出现我们的网址水印。

同意并开始全文预览

(约 1-6 秒)

1/6 下载此文档

文档列表 文档介绍

基于神经网络的古钱币图像检索研究
施雨于瓅吴明祥胡梦龙摘要:古钱币是我国重要的文化遗产,具有较高的文化和艺术价值,为了加强对古钱币的保护,需要对其进行识别和检索。针对古钱币图像的检索问题,该文提出了一种基于卷积神经网卷积神经网络的原始版本LeNet,随后于1998年提出基于梯度学****的LeNet-5模型[5]。因受限于数据量大小和计算速度的不足,当时的网络在分类任务中的表现不佳。2012年,Krizhevsky等饿[6]提出AlexNet架构,夺得ILSVRC2012的图像分类任务的冠军,对比传统机器学****方法,其表现已相当出色。该文将采用卷积神经网络对古钱币数据集的图片进行二进制编码,得到每张古钱币图像的二进制编码,可用该二进制编码用于图像检索。
1 该文方法
模型的输入为古钱币图像及其类别标签信息,主要包括3个部分:(1)卷积子网络,用来学****表示古钱币图像的特征;(2)编码层,将第二个全连接层输出的特征向量激活、阈值化处理并生成二进制编码;(3)损失层,采用Softmax损失函数。首先输入古钱币图像,进入卷积子网络得到图像的特征向量;其次进入编码層,将特征向量转换为二进制编码;最后进入损失层计算损失函数,优化损失函数得到模型的参数。
卷积子网络
卷积子网络用于学****图像的特征表示,输入图像经过一系列卷积、池化等操作后们可以得到图像的特征向量。该文采用AlexNet[6]模型作为基本架构,其中包括5个卷积层、3个最大池化层和2个全连接层。输入图片大小为224×224,经过核大小为11×11、步长为4的卷积层处理后输出55×55×96的向量,随后进行LRN(Local Response Normalization,局部响应归一化)处理,接着经过3×3、步长为2的最大池化操作,输出27×27×96的向量。与此类似,经过一系列卷积、池化操作后,进入全连接层6和全连接层7,最终输出4096×1用来表示图像特征的特征向量。
编码层和损失层
图像经过全连接层7后产生特征向量x之后,将进入编码层。首先对x进行sigmoid函数处理,将一维向x量映射为[0,1]之间的数值,得到激活层输出向量s。假设特征向量x的维数为n,则输出向量s维数也为n,该过程表示为:
经过激活层得到的向量s随即进入阈值化层,阈值化层主要将激活层映射到[0,1]之间的连续值离散化为0和1,将大于阈值的值处理为1,小于阈值的值处理为0,,该过程表示为:
经过阈值化层处理后,得到图像对应的二进制编码。损失层函数采用Softmax损失函数,阈值化层得到的编码进入Softmax分类器进行分类,通过优化Softmax损失函数来获得模型的参数。
2 实验结果分析
实验设置
为了验证该文方法的有效性,在手动采集的古钱币数据集上进行模型实验。该数据集包含10000张大小为224×224的古钱币彩***片,包含康熙年间的10类钱币样式,现从每个类别中随机选取9000张图像作为训练集和1000张图像作为测试集。
该文采用MAP、海明距离2以内的准确率曲线以及top-k准确率曲线这3个参数进行评估。其中,MAP即图像平均检索精度(mean average

基于神经网络的古钱币图像检索研究来自淘豆网www.taodocs.com转载请标明出处.