出版时间:2010-7 出版社:北京师范大学出版集团,北京师范大学出版社 作者:朱小健,张全,陈小盟 著 页数:465
Tag标签:无
前言
本书是第四届“HNC与语言学研究学术研讨会”的论文集。 HNC是概念层次网络理论的简称,该理论由中国科学院声学研究所黄曾阳先生创立,它的基本特征是通过构建语言概念空间来探索和模拟大脑的语言理解过程。 “HNC与语言学研究学术研讨会”(简称“HNC研讨会”)最早由语言学家邢福义先生和黄曾阳先生倡议,它有三个基本宗旨:一是搭建语言信息处理界的学术交流平台,以碰撞促发展;二是创造有利于原创性新思想发展的学术环境,鼓励和发扬创新;三是理论探索与应用实践并重,促进学术界和产业界的沟通与互动。第一届HNC研讨会于2001年4月在华中师范大学举行,第二届于2003年9月在中国科学院声学研究所举行,第三届于2005年12月在北京师范大学举行。 第四届HNC研讨会于2009年11月14日至15日在北京师范大学举行,本届研讨会留给与会者的感受可以概括为四点:第一,HNC的基础研究和应用开发与四年前相比又取得了很大的进展,HNC团队进一步壮大;第二,学术界和产业界对HNC理论与技术有了更多的关注和了解;第三,中文信息处理的各个方面都在不断向前发展,新的思想、理论和技术不断产生,各个流派之间的交流不断扩大和加深;第四,论文作者大多是年轻的生力军,说明我国语言信息处理的发展后继有人。 前三届HNC研讨会的论文集,书名分别为《HNC与语言学研究》《第二届HNC与语言学研讨会论文集》《中文信息处理的探索与实践》,本届HNC研讨会论文集的书名定为《HNC与语言学研究(第4辑)》,以后将固定采用这一名称,只是改变括号中的数字,以与研讨会的届数对应。 本书收录了第四届HNC研讨会上宣读的74篇论文,分为6个部分: 1.基础理论和语言本体研究(14篇) 2.知识库资源建设及其应用(12篇) 3.基础技术研究与开发(16篇) 4.应用研发之一:机器翻译(14篇) 5.应用研发之二:信息检索和抽取(11篇) 6.其他应用技术和系统研发(7篇) 其中第四部分集中反映了HNC的最新进展,即在机器翻译方面的基础研究和应用实践。 本书出版时间比较仓促,编者水平也有限,如有疏漏和不妥之处,恳请读者和论文作者批评指正。
内容概要
《HNC与语言学研究(第4辑)(2009)》是第四届HNC与语言学研究学术研讨会的论文集,所收录的论文展现了HNC(HierarchicalNetWworkofConcepts,概念层次网络)理论、语言学和语言信息处理界近些年来研究和应用研发的若干新成果。《HNC与语言学研究(第4辑)(2009)》的内容分为6个部分:(1)基础理论和语言本体研究;(2)知识库资源建设及其应用;(3)基础技术研究与开发;(4)机器翻译;(5)信息检索和抽取;(6)其他应用技术和系统研发。《HNC与语言学研究(第4辑)(2009)》的读者对象包括自然语言处理、语言学、人工智能和认知科学等领域的研究者和开发者。
书籍目录
第一部分 基础理论和语言本体研究把文字数据变成文字记忆关于汉语语义概念的一点思考概念基元空间的下沉及与词义结构的语言对接现代汉语空间短语的基本类型组织名在主流媒体上的分布信息及其价值从HNC看“从到”的语义角色及其判定HNC与本体概念网的比较研究面向汉语框架语义知识库的动词“感觉”分析面向自然语言处理的人机语义研究基于HNC理论的“是的”结构研究及教学谈HNC的知识表示方法面向自然语言处理的语言本体研究标点句的独立性判断网络流行语的叙事特点及功能第二部分 知识库资源建设及其应用语义互联网与《新编同义词词林》事件描述块句法语义标注库的构建释雅例句检索工具的需求分析动词词典在汉语词汇教学中的应用略论基于HNC的学习型电子词典编纂研究HNC语义标注语料库查询工具的用户需求句群处理突破的关键:HNC领域句类知识库汉英双语多元逻辑组合标注的基本内容法治活动的领域句类表示式和知识描述基于本体的多媒体教学资源管理及检索研究语言资源建设的理论与实践初探跨越语句理解的知识(库)建设第三部分 基础技术研究与开发无头迭句与花园幽径句的辨识与处理英语特征语义块构成分析及计算机处理结合领域句类知识的省略恢复方法面向大句处理的句类分析系统的设计与实现英语非限定形态动词分析处理宪法句间回指模糊的消解研究汉语理解处理中的动态词及其组合模式句处理与句群处理利用读音信息的词语切分处理现代汉语文本中四字语的识别英语主辅语义块辨识初探中文机构名识别需要使用的知识资源现代汉语数量短语及其自动识别的研究HNC符号的解析及应用中文信息处理中兼类词研究困难的原因HNC理论的句类假设检验知识与现有句类分析系统E语义块识别的检测分析第四部分 应用研发之一:机器翻译形如独立小句的原型句蜕之汉英变换从HNC机器翻译评测看机器翻译发展从一项实证研究看机器翻译的路线之争面向汉英机器翻译的格式自转换研究关联于是否判断句的迭句转换研究——以汉英机器翻译为视角英语方式动词在英汉机器翻译中的处理分析汉英机器翻译中的辅块序位研究英汉机器翻译中“0F”结构的处理基于HNC理论的时间辅语义块的汉英机器翻译初探块扩句的汉英句类及句式转换汉语小句向英语辅块的变换研究汉英机器翻译中“以为”句式的理解处理统计机器翻译的句法调序与HNC句式转换简析机器翻译软件的需求第五部分 应用研发之二:信息检索和抽取中文文本中企业并购信息的自动抽取农业信息检索中含单动词和双名词的词语串之语义理解策略针对HNC理论的特殊语序结构的抽取策略——基于足球比赛报道新闻文本的抽取任务求职简历信息的自动抽取基于规则的人物关系抽取所需的语言知识研究搜索引擎的个性化和智能化农业信息智能检索的知识需求分析基于HNC理论的精确检索方法的设计与实现中国奥运冠军动态信息抽取技术研究专利文献检索再分类的语言知识网络文本中对企业产品和服务评价倾向的表达方式分析第六部分其他应用技术和系统研发基于HNC的网络信息舆情分析系统应用HNC知识检索系统在专利文献检索中的应用HNC在农业垂直搜索中的应用HNC在Web日志管理中的应用探讨HNC在网站客服系统中的应用探讨基于向量空间模型的话题主动发现和跟踪汉语网络词典的现状和发展方向浅析
章节摘录
大脑的软件似乎也可以同计算机作某种类比,划分为自我操作和对外服务两个侧面。前者密切联系于CPU+MEM,后者密切联系于(I/O,MEM,CPU)。 大脑的操作软件有什么不同于计算机的本质区别? HNC的答案是:大脑操作软件存在着智能与智慧的基本差异。这里不介绍智能与智慧的定义及其HNC符号表示式,只用一个例子来表明两者之间的巨大不同。柏拉图与孔夫子、恺撒与拿破仑都智力超群,但两位夫子和两位将军的具体智力表现可大不相同,能不能说“两位夫子智慧超群而智能平平,两位将军智能超群而智慧平平”呢?好像是可以这么说的,可见,智力存在着智能与智慧的本质区分。孔夫子正是由于智能平平而于最近引出了“孔子,丧家犬”的命题,这命题受到许多学者的盛赞。但问题不在于盛赞或反对,而在于对先哲的基本态度。柏拉图经历过与孔子极为类似的境遇,但希腊人和西方人绝不会把丧家犬之类的侮辱性描述加到柏拉图身上。尼采先生确实喊出过“上帝死了”,但绝不会超出这个限度而高喊“打倒上帝”。 数据和记忆是两种性质截然不同的信息载体。数据仅涉及信息的量与形式,不涉及信息的质与内容,无关于智能与智慧的差异;记忆则不仅涉及信息的量与形式,更涉及信息的质与内容,有关于智能与智慧的差异。可见,记忆所要求的信息形态转换,其难度必远大于数据。作为一项科技课题,“高级信息形态转换”的命运非常奇特,很像那位出塞前的王昭君。 1.4 准备迎娶“昭君” 可是,命运类似于王昭君的“高级信息形态转换”并不是“昭君”,而是“昭君”的未来夫婿。 上面说到的那位数字化美人才是“昭君”,她还没有找到如意郎君。上帝似乎在刻意安排一场年龄差距破历史纪录的姐弟恋。那位美人的芳龄已经超过了30岁,可是那位未来的新郎还没有出世。他以胎儿的形态已经存在多年了,但还没有降生。最近的检查表明,胎儿发育正常,主要问题是母亲营养不良。预产期还没有完全确定,乐观的估计是2012年,在座诸君应该都能赶上。不过,能在这个研讨会上想象一下从“昭君出塞”到“迎娶昭君”的历史巨变,已经是足够欣慰的事了。
图书封面
图书标签Tags
无
评论、评分、阅读与下载