出版时间:2009-11 出版社:清华大学出版社 作者:冯大淦,萧允治,张宏江 著,刘晓冬 译 页数:400 译者:刘晓冬
Tag标签:无
前言
多媒体信息技术为广泛的应用领域提供了全面的和直观的信息,对现代生活有强烈的影响并已改变了我们的学习和思考方式。近20年来,在Intemet和无线通信上对数字多媒体(包括音频、视频、图像和图形)的使用有了一个爆炸性的增长。随着对数字多媒体使用的增加,有效的数据存储和管理变得越来越重要。在使用大量数据的领域(例如,音频、视频、图像和数字图书馆;地理和医学图像数据库等),我们需要在满足对精确的数据表达经常相互冲突的需求的同时,最小化存储的数据量。此外,数据需要被管理从而促进高效的搜索、浏览和协同工作。这个领域在近年来已经是一个非常活跃的研究领域。本书将为读者提供那些直接影响我们的工业、经济和社会生活的多媒体信息检索和管理领域的前沿技术的最新的和综合的描绘。本书分成两个主要的部分:覆盖该领域核心理论的技术基础部分和描述该技术广泛的实际使用的应用部分。全书包括:对于数字音频、音乐、图像和视频基于内容检索的一套完整的技术;多媒体低级特征提取和高级语义描述,以及最新的MPEG一7标准;多媒体认证和水印;广泛的实际应用(例如,数字图书馆、医学图像和生物特征识别等)。本书适合于用作高年级大学生和研究生的教材,也可以作为多媒体研究者、开发者和从业者的参考手册。本书的贡献者都是在他们的领域中的杰出的研究者,包括:哥伦比亚大学的Shih.Fu Chang教授,他是IEEE 2002年的杰出演讲者;南加州大学的H.K.Huang教授,他是“图片存档和通信系统(。PACS)”的作者和PACS系统的开拓者,以及EdwardA.Fox教授,他是弗吉尼亚理工大学因特网技术创新中心的主任和ACM计算教育资源学报的共同主编。我们要感谢这些贡献者的出色的配合,使得我们能够满足很紧的撰写截止时间,也确保了本书所包含的信息是最新的。我们还要感谢Z.Y Wang先生和W..Ho女士在编辑这本书时给予的专业协助,并感谢Springer-Verlag出版社在整个过程中的支持和效率。
内容概要
本书是一本关于多媒体信息检索和管理领域的经典著作,倾注了该领域世界众多知学者的研究成果和贡献,在国外许多重点大学作为计算机专业本科生和研究生的教材。本书填补了我国在该研究领域译著的空白。 本书从理论基础和实践应用两个方面对当前流行的多媒体信息检索和管理领域的技术和系统进行了完整和详细地介绍。全书共分两大篇,即技术基础篇和应用篇,共21章,内容包括对于数字音频音乐、图像和视频基于内容检索的一套完整的技术;多媒体低级特征提取和高级语义描述,以及最新的MPEG一7标准;多媒体认证和水印;广泛的实际应用(例如,数字图书馆、医学图像和生物特征识别等)。 本书适用读者很广泛。对于想学习和了解计算机多媒体信息检索和管理的本科生、研究生,本书可作为他们的教材或教学参考书。对于那些从事计算机多媒体信息检索和管理工程领域的研究开发人员、技术服务人员和用户等,本书也是一本很好的参考书。
作者简介
冯大淦,于1988年在美国加州大学洛杉矶分校获得计算机科学博士学位。在美国短暂地任助理教授一段时间后,加入了澳大利亚悉尼大学并先后任讲师。高级讲师。副教授和教授。他是悉尼大学计算机科学系信息技术学院的前系主任。他现任悉尼大学理学院的副院长和悉尼大学生物医学和多媒体信息(BMIT)研究组的主任,以及香港理工大学电子和信息工程系多媒体信号处理研究中心的教授和副主任。他已经发表了200多篇学术研究论文,开创了几个新的研究方向,在他的领域作出了许多重大的贡献。因为在生物医学工程方面的杰出成就获得了Crump奖。然而更重要的是,他的很多研究成果已经被转化为世界性的现实生活问题的解决方案,并已对人们的生活质量做出了巨大的改善。他现在是IEEE Transactionson Information Technologyin Biomedicine的专题领域编辑,International Journal of Imageand Graphics的顾问,IFAC-TC-BIOMED的主席,以及IFAC2003研讨会的国际程序和国家组织委员会主席。他是ACS。HKIE。IEE和IEEE的院士。萧允治,于1984年在英国伦敦帝国理工和医学院获得博士学位。1975—1980年在香港中文大学工作。1980年加入香港理工大学任讲师,自1992年开始成为讲座教授。他还承担了管理工作,1992—1994年,他任工程学院副院长。1994—2000年任电子和信息工程系主任,2000—2002年任工程学院院长。Siu教授自1998年9月以来一直担任多媒体信号处理中心主任。已发表研究论文200多篇,他的研究兴趣包括数字信号处理。快速计算算法。变换。图像和视频编码,以及模式识别和神经网络的计算方面。Siu教授是信号。图像和视频技术的VLSI信号处理系统学报和应用信号处理的EURASIP学报的编委会成员。他是1998年5月出版的IEEE Transactionson Circuits and SystemPt。II专刊的客座编辑,以及在1995—1997年之间出版的IEEE Transactions On Circuitsand SystemPt。II专刊的副编辑。Siu教授担任过许多国际会议的大会主席或技术程序主席。特别地,他是IEEE电路和系统国际研讨会(ISCAS'97)的技术程序主席,以及在香港举行的2003IEEE声学。语音和信号处理国际会议(ICASSP'2003)的大会主席。1991—1995年期间,Siu教授是香港政府科研经费委员会(RGC)物理科学和工程专家组的成员。1994年他担任第一个工程和信息技术专家组席,评估了香港全部大学中的19个成本中心(系)的研究质量。张宏江,于1991年在丹麦Lyngby的丹麦工程技术大学获得博士学位。他在新加坡国立大学系统科学研究所和美国惠普实验室担任研究管理者。Zhang博士于1999年加入微软亚洲研究院(MRA),担任高级研究员和MRA院长助理。Zhang博士在多媒体研究领域以他在视频和图像内容分析。表达。检索和浏览方面的开创性工作而闻名,已经发表了3本著作,200篇被引用的论文和书的章节,以及大量的在多媒体处理和基于内容的媒体检索领域的专业学报的专辑。他有30多项美国专利和专利申请。Zhang博士是《多媒体系统图像和视频处理》的作者之一,这是第一本介绍基于内容的图像和视频检索研究的著作。该书自1995年在Kluwer出版社出版以来,已经成为经典参考教材,并且包含在其中的研究已经成为几个初创公司的技术基础。Zhang博士是5个专业学报和12个国际会议的编委会成员,包括ACM1999多媒体会议程序委员会共同主席。
书籍目录
第1部分 技术基础篇 第1章 基于内容的图像检索基础 第2章 基于内容的视频分析、检索和浏览 第3章 基于内容的图像检索的相关反馈 第4章 结构和语义层次的视频分析和摘要 第5章 数字音频和音乐的基于内容的检索 第6章 MPEG-7多媒体内容描述标准 第7章 多媒体认可和水印技术 第8章 索引和检索高维视觉特征 第9章 多媒体数据库的语义数据建模机制 第10章 可视化数据库系统中基于特征的检索 第2部分 应用篇 第11章 数字图书馆 第12章 数字图书馆的可扩展存储 第13章 数字图书馆的对象知识库 第14章 万维网上的信息发现 第15章 协同多媒体信息系统 第16章 图片存档及通信系统、图像管理和影像信息学 第17章 医学数据基于内容的检索 第18章 使用掌纹图像的生物特征检索 第19章 在人脸数据库中查找人脸 第20章 活体植物识别的数据管理 第21章 广播视频的快速启动与交互式检索
章节摘录
插图:用户可以用多种方式指定希望从数据库中检索什么种类的图像。普遍使用的查询表达是:类别浏览(caLtegory browsing)、概念查询(query by concept)、草图查询(query by sketch)和示例查询(query by example)。类别浏览是根据图像的类别浏览数据库。为了这个目的,数据库中的图像根据它们的语义或可视化内容被分成不同的种类。概念查询是根据和数据库中的每幅图像相关的概念描述来检索图像。草图查询和示例查询是画一幅草图或提供一幅示例图像,具有与其类似的视觉特征的图像将被从数据库中提取出来。前两种类型的查询是相关于图像的语义描述的,将在下一章中介绍。草图查询允许用户使用检索系统或者某一其他软件提供的图形编辑工具来画出一幅图像的草图。可以通过画若干具有特定颜色、纹理、形状、尺寸和位置等属性的对象来形成查询。在大部分情况下,一幅粗略的草图就足够了,因为查询能够基于检索结果被细化。示例查询允许用户通过提供一幅示例图像来表达查询。系统把示例图像转换成特征的内部表达。存储在数据库中的具有相似特征的图像然后被搜索。示例查询能够被进一步划分为外部图像示例查询(如果查询图像不在数据库中)和内部图像示例查询(否则)。示例查询的主要优点是用户不需要提供对目标的明确描述,而是改为由系统计算出来。它适合于目标是具有相同的对象或对象集合在不同观察条件下的图像的应用场合。大部分当前的系统提供这种形式的查询。成组示例查询允许用户选择多幅图像。然后系统将发现与这组示例的公共特征最匹配的那些图像。使用这种查询方式,目标能够通过在查询中指定相关的特征变化并去除不相关的变化而被精确地定义。此外,成组的特性能够通过添加反例而被细化。很多最近开发的系统都同时提供了正反示例查询。
编辑推荐
《多媒体信息检索与管理》:世界著名计算机教材精选
图书封面
图书标签Tags
无
评论、评分、阅读与下载