您现在的位置: 范文先生网 >> 理工论文 >> 计算机论文 >> 正文

MPEG-7与媒体资产检索

时间:2007-1-30栏目:计算机论文

MPEG-7与媒体资产检索

1、 引言    随着电视技术与IT技术的不断融合,以及IT技术日新月异的发展,实现视音频信息的数字化管理即所谓的媒体资产管理已成为可能。但要实现对庞大的视音频数据进行组织、管理及检索,仅仅有数字化的视音频信息是远远不够的,这时便提出了所谓的"元数据(Metadata)"技术。"元数据"就是描述数据的数据,即有关视音频信息的描述信息。但现在多数媒体资产管理系统都是按照传统的管理信息系统的方式组织和管理元数据的,即将视音频信息进行编目,再将编目信息(元数据)存入数据库以备日后的检索和管理。这种方式对于版权、作者、主题等等文本信息是很有效的,但是要实现真正的面向内容的管理就力不从心了。针对这一问题,MPEG (Moving Picture Experts Group)推出了基于内容的多媒体描述标准MPEG-7。MPEG-7标准重点在于AV(Audiovisual)信息的描述和定义,以明确的结构和语法来定义AV信息的内容。它的正式名称是"多媒体内容描述接口(multimedia content description interface)"。通过MPEG-7格式定义的信息,使用者可以有效地搜寻、过滤和定义想要的视音频资料。 2、 MPEG-7     MPEG-7于2001年推出,它本身并不试图定义一种新的数字压缩方法,而主要是针对基于内容的多媒体描述问题。 2.1 MPEG-7标准的范围     MPEG-7是MPEG继MPEG-1、MPEG-2、MPEG-4之后制定的新标准,但它与前三个标准不同,它超越基于波形或基于样本、基于压缩(如MPEG-1和MPEG-2)甚至是基于对象(如MPEG-4)的表示,也超越具体的存储方式(如可以应用于存储在磁带、影片等上模拟信号也可以应用于存储在磁盘、光盘上的数字信号,甚至可应用于存在于纸上的图形、图片),其目的是建立一种基于多媒体内容的描述方式,以便更有效地支持多媒体资料在产生、存储、交换、传输等过程中的各种应用,这些应用包括搜索引擎、编辑工具和个性化的检索机制等。但MPEG-7并不涉及这些就在具体的应用本身,而是仅仅定义了多媒体内容的描述方法,图1是关于MPEG-7标准内容的抽象描述。 MPEG-7与媒体资产检索     MPEG-7对多媒体信息的描述目前主要包括以下几个方面(当然,随着应用的不断深入,MPEG-7也在不断的扩充和完善): ● 有关媒体制作方面的信息(如媒体的制作商、标题等);
● 有关媒体使用方面的信息(如媒体的版权、使用记录等);
● 有关媒体存储方面的信息(如媒体的编码方式、存储格式等);
● 有关媒体时间域、空间域方面的信息(如媒体中的场景切换、区域分割等);
● 有关媒体特征方面的信息(如媒体的灰度、纹理、音频特征等);
● 有关媒体内容表述方面的信息(如媒体中包括的对象、事件及其之间的相互关系等)。
2.2 MPEG-7描述
MPEG-7定义了一组的描述方法和工具,主要包含:
● 描述子D (Descriptors):用来描述多媒体内容的各种特征。
● 描述方案DS (Description Schemes):用来描述D之间的结构及关系。
● 描述定义语言DDL(Description Definition Language):用来定义D和DS的语言。     一个MPEG-7描述(descriptions)由一组DS实例组成,并与AV素材的内容链接,以使用户能够快速、有效地访问需要的AV素材。描述可以与AV素材存储在同一存储系统中,也可以异地、远程存储。 2.2.1描述子     MPEG-7定义了一组标准的描述子,下表列出的是一些MPEG-7的视觉描述子: 类型 特征 描述子 视觉 结构 网格分布 二维/三维多视图 时间序列 三维空间坐标系 时间插值 颜色 颜色空间 颜色量化 颜色直方图 主颜色 可扩展颜色 颜色结构 颜色分布 GOF/GOP颜色 纹理 边缘直方图 同类纹理 纹理浏览 形状 对象范围 基于区域的形状 基于轮廓的形状 三维形状 运动 镜头运动 对象运动轨迹 参数运动 运动速度 位置 区域定位子 时空定位子 其它 人脸描述子     每个描述子都定义了标准和非标准两个部分,标准部分定义了描述子的语法、语义及其二进制的表示法。而操作部分是非标准的部分,许多低层的特征(如颜色直方图等)都是可以自动抽取的,推荐使用的特征抽取及匹配算法都包含在非标准的部分。 2.2.2描述方案     描述方案(DS)定义了各组成部分之间的结构和语义关系,它由描述子(D)和描述方案(DS)组成,下面是在AV内容描述方案中常用到的几个概念: ● 语法结构:AV内容的物理和逻辑结构,如时间片断、空间区域的基础结构。
● 语义结构:语义含义的细分,如时间事件、空间对象结构。
● 语法语义链接:语法元素与语义元素间的结合。
一个顶层的AV描述方案往往是由多个描述方案组成:
● 一组语法结构描述方案(Syntactic structure DS):即片断、区域、颜色、文本、运动等物理特征的描述。
● 一组语义结构描述方案(Semantic structure DS):即对象、人物或事件等语义特征,如"进球"、"射门

[1] [2] [3] 下一页

下页更精彩:1 2 3 4 下一页