- 相关推荐
MPEG-7与媒体资产检索
MPEG-7与媒体资产检索
1、 引言 随着电视技术与IT技术的不断融合,以及IT技术日新月异的发展,实现视音频信息的数字化管理即所谓的媒体资产管理已成为可能。但要实现对庞大的视音频数据进行组织、管理及检索,仅仅有数字化的视音频信息是远远不够的,这时便提出了所谓的"元数据(Metadata)"技术。"元数据"就是描述数据的数据,即有关视音频信息的描述信息。但现在多数媒体资产管理系统都是按照传统的管理信息系统的方式组织和管理元数据的,即将视音频信息进行编目,再将编目信息(元数据)存入数据库以备日后的检索和管理。这种方式对于版权、作者、主题等等文本信息是很有效的,但是要实现真正的面向内容的管理就力不从心了。针对这一问题,MPEG (Moving Picture Experts Group)推出了基于内容的多媒体描述标准MPEG-7。MPEG-7标准重点在于AV(Audiovisual)信息的描述和定义,以明确的结构和语法来定义AV信息的内容。它的正式名称是"多媒体内容描述接口(multimedia content description interface)"。通过MPEG-7格式定义的信息,使用者可以有效地搜寻、过滤和定义想要的视音频资料。 2、 MPEG-7 MPEG-7于2001年推出,它本身并不试图定义一种新的数字压缩方法,而主要是针对基于内容的多媒体描述问题。 2.1 MPEG-7标准的范围 MPEG-7是MPEG继MPEG-1、MPEG-2、MPEG-4之后制定的新标准,但它与前三个标准不同,它超越基于波形或基于样本、基于压缩(如MPEG-1和MPEG-2)甚至是基于对象(如MPEG-4)的表示,也超越具体的存储方式(如可以应用于存储在磁带、影片等上模拟信号也可以应用于存储在磁盘、光盘上的数字信号,甚至可应用于存在于纸上的图形、图片),其目的是建立一种基于多媒体内容的描述方式,以便更有效地支持多媒体资料在产生、存储、交换、传输等过程中的各种应用,这些应用包括搜索引擎、编辑工具和个性化的检索机制等。但MPEG-7并不涉及这些就在具体的应用本身,而是仅仅定义了多媒体内容的描述方法,图1是关于MPEG-7标准内容的抽象描述。● 有关媒体使用方面的信息(如媒体的版权、使用记录等);
● 有关媒体存储方面的信息(如媒体的编码方式、存储格式等);
● 有关媒体时间域、空间域方面的信息(如媒体中的场景切换、区域分割等);
● 有关媒体特征方面的信息(如媒体的灰度、纹理、音频特征等);
● 有关媒体内容表述方面的信息(如媒体中包括的对象、事件及其之间的相互关系等)。
2.2 MPEG-7描述
MPEG-7定义了一组的描述方法和工具,主要包含:
● 描述子D (Descriptors):用来描述多媒体内容的各种特征。
● 描述方案DS (Description Schemes):用来描述D之间的结构及关系。
● 描述定义语言DDL(Description Definition Language):用来定义D和DS的语言。 一个MPEG-7描述(descriptions)由一组DS实例组成,并与AV素材的内容链接,以使用户能够快速、有效地访问需要的AV素材。描述可以与AV素材存储在同一存储系统中,也可以异地、远程存储。 2.2.1描述子 MPEG-7定义了一组标准的描述子,下表列出的是一些MPEG-7的视觉描述子: 类型 特征 描述子 视觉 结构 网格分布 二维/三维多视图 时间序列 三维空间坐标系 时间插值 颜色 颜色空间 颜色量化 颜色直方图 主颜色 可扩展颜色 颜色结构 颜色分布 GOF/GOP颜色 纹理 边缘直方图 同类纹理 纹理浏览 形状 对象范围 基于区域的形状 基于轮廓的形状 三维形状 运动 镜头运动 对象运动轨迹 参数运动 运动速度 位置 区域定位子 时空定位子 其它 人脸描述子 每个描述子都定义了标准和非标准两个部分,标准部分定义了描述子的语法、语义及其二进制的表示法。而操作部分是非标准的部分,许多低层的特征(如颜色直方图等)都是可以自动抽取的,推荐使用的特征抽取及匹配算法都包含在非标准的部分。 2.2.2描述方案 描述方案(DS)定义了各组成部分之间的结构和语义关系,它由描述子(D)和描述方案(DS)组成,下面是在AV内容描述方案中常用到的几个概念: ● 语法结构:AV内容的物理和逻辑结构,如时间片断、空间区域的基础结构。
● 语义结构:语义含义的细分,如时间事件、空间对象结构。
● 语法语义链接:语法元素与语义元素间的结合。
一个顶层的AV描述方案往往是由多个描述方案组成:
● 一组语法结构描述方案(Syntactic structure DS):即片断、区域、颜色、文本、运动等物理特征的描述。
● 一组语义结构描述方案(Semantic structure DS):即对象、人物或事件等语义特征,如"进球"、"射门"、"广告"等。
● 语法语义链接描述方案(Syntactic-semantic links DS):即语法元素和语义元素之间的关系。
● 摘要描述方案(Summary DS):用于不同粒度间的浏览。
● 媒体信息描述方案(MetaInfo DS):有关作者、出版者等信息的描述,包括内容描述方案、信用描述方案、创作目的描述方案、版权描述方案、出版描述方案等。
● 介质信息描述方案(MediaInfo DS):有关存储介质的描述,如文件格式、存储介质、压缩格式、长度等。
● 模式描述方案(Model DS):提供AV数据的分类方法的描述或当前AV内容和其它内容间的通信的不同方法。 图2是一个AV描述方案的结构描述:
● XML语言的数据类型部分
● MPEG-7的扩展部分 DDL语言、描述方案、描述子之间的关系见图3。
1、 ISO/IEC JTC1/SC29/WG11 N4031. Overview of the MPEG-7 Standard (version 5.0). José M. Martínez
2、 D-Lib MagazineSeptember 1999. MPEG-7 Behind the Scenes. Jane Hunter
3、 http://www.cbttn.com.《MPEG-7及其在广播电视中的应用》. 张颖辉、陶然、王越、马越
4、 北京邮电大学出版社.《MPEG-7标准及其应用》.余兆明、李晓费、陈来春、
【MPEG-7与媒体资产检索】相关文章:
多级存储技术在媒体资产管理系统中的应用08-06
实习检索报告08-16
谈谈宁夏地方文献检索08-09
信息检索心得体会08-20
文献检索心得体会12-06
文献检索课学习心得04-20
文献信息检索心得体会03-21
信息检索课的心得体会04-01
信息检索课心得体会04-17