论文分类号:TP单位代码:
密级:内部研究生学号:
吉林大学
硕士学位论文
基于内容的视频检索方法的研究及实验系统的开发
Research of the Methods of Content-based Video Retrieval
and Design of Experimental System
作者姓名: 张若英
专业: 计算机应用技术
导师姓名: 申铉京
及职称: 教授
论文起止年月: 年月至年月
提要
在网络与信息高速发展的时代,计算机所能处理的信息媒体范围迅速扩
大,不仅要求数据库和其它信息系统能对图像、视频和声音等媒体进行存储
和基于关键字的检索,而且要对多媒体数据的内容进行语义分析,以达到更
深的检索层次,从而多媒体数据库基于内容的检索应运而生[1]。基于内容的
视频检索(V )就是这其中的一个重
要研究领域。
本文在占有大量相关领域资料、对图像处理及分析理论进行深入理解的
的基础上,分析研究了现有的基于内容的视频处理、检索方法,并在图象预
处理及分析环节作了大量工作。在对原有的视频检索的关键帧算法的理解、
分析、检验的基础上,提出了应用基于模式识别最小距离分类器的欧氏距离
峰值检测法,基于最小二乘逼近的直线拟合与抛物线拟合检测法。另外,本
文采用几何矩阵模型,使用最小距离分类法来判定所有关键帧与给定的示例
图像的相似度,从而实现图像的匹配工作。
本文所采用的关键帧检测技术一定程度上改进了检索效果,使查到率与
查准率都得到了提高,尤其是基于最小二乘法的抛物线拟合算法既提高了速
度又提高了准确率,针对渐变镜头中细微变化的的检测,可以通过阈值的不
断调整逐步逼近高精度的检索结果。
第一章绪论
问题的提出
随着技术的迅速发展,图像、视频等多媒体数据已逐渐成为信息处理领
域中主要的信息媒体形式。多媒体数据(Multimedia Data)是指多种式样信
息的载体,例如:文本、图形、图象、声音等数据。其特点是:( 1)多媒体
数据种类繁多(大多是非结构化数据),来源于不同的媒体,具有完全不同的
形式和格式;( 2)多媒体数据量庞大;( 3)多媒体数据具有时间特性和版本
概念,如在视频点播系统中必须考虑到媒体间以及媒体内部在时间上的同步
关系[2]. 由此可知多媒体数据与传统的数值和字符不同,因而其存储结构和
存取方式也具有特殊性,描述它的数据结构和数据模型也是有差别的. 在这
种情况下产生了一种全新的数据库系统──多媒体数据库系统。
多媒体数据库是能够有效实现多媒体数据的存储、读取、检索等功能的
数据库系统[3]。它的主要特点是:首先,继承了传统数据库的一些优点,例
如数据独立性、利用数据库查询语言进行高层次查询、并发控制、容错技术
等等;其次它能对具有时空关系的数据进行同步和管理。但是目前对于多媒
体数据库的功能以及实现方法还没有达成共识,因而出现了多种形式的多媒
体数据库,并且实现方法也各不相同。从其总体发展上看,多媒体数据库的
数据模型可分为三类:(1) 关系数据模型;(2) 面向对象的数据模型
[Vazirgiannis 1993] [Zhang 1994];( 3)超媒体数据模型。基于不同数据模型
的多媒体数据库管理系统的功能也有很大差别,通常基于关系数据模型的多
媒体 DBMS 可以实现多媒体数据的存取,对多媒体数据对象之间的语义关
系、时态关系、空间关系不加处理,所以这部分工作就留给应用程序去完成
了。面向对象的数据模型和超媒体数据类型可以支持多媒体数据对象之间的
语义关系、时态关系、空间关系的处理,其抽象程度更高,但 DBMS 的实现
也相对复杂[4][5]。
在网络与信息高速发展的时代,计算机所能处理的信息媒体范围迅速扩
大,不仅要求数据库和其它信息系统能对图像、视频和声音等媒体进行存储
和基于关键字的检索,而且要对多媒体数据的内容进行语义分析,以达到更
深的检索层次,从而多媒体数据库基于内容的检索应运而生。
目前基于内容的检索主要有三个方向:视频( ),音频( ),
图像( )。
所谓基于内容的检索( , 一),是指根
据媒体对象的语义和上下文联系进行检索,它有如下特点:
·从媒体内容中提取信息线索。基于内容的检索突破了传统的基于表
达式检索的局限,它直接对图像、视频、音频进行分析,抽取特征。利用这
些内容特征建立索引进行检索。
·基于内容的检索是一种近似匹配。在检索的过程中,它采用相似性
匹配的方法逐步
基于内容的视频检索方法的研究及实验系统的开发 来自淘豆网www.taodocs.com转载请标明出处.