俄罗斯计算语言学与机器翻译

出版时间:2009-8  出版社:语文出版社  作者:傅兴尚,等 编  页数:424  
Tag标签:无  

前言

  序言  近年来,我国计算语言学开始注意引进和介绍国外先进的理论和技术,但是,这些引进和介绍主要是针对欧美等发达国家的,对于俄罗斯的介绍寥寥无几,至于引进那就更是微乎其微了。这是一件非常遗憾的事情。  俄罗斯是我国的友好邻邦,在计算语言学和机器翻译研究方面,俄罗斯的起步比我国早得多。  在计算语言学方面,早在1913年,俄罗斯著名数学家马尔可夫(A.A.MAPKOB,1856-1922)就注意到语言符号出现概率之间的相互影响,他试图以语言符号的出现概率为实例,来研究随机过程的数学理论,提出了马尔可夫链的思想,他的这个开创性的成果用法文发表在俄罗斯皇家科学院的通报上。后来马尔可夫的这一思想发展成为在计算语言学中广为使用的马尔可夫模型是当代计算语言学最重要的理论支柱之一。在用数学思想来研究语言的创新性研究中,我们甚至可以追溯到19世纪中叶,早在1847年的时候,俄罗斯数学家布良柯夫斯基就提出了用概率论方法来进行语法、词源和语言历史比较研究的卓越见解了。1958年,苏联数学家库拉金娜采用集合论描述了基本的语法概念,为机器翻译研究奠定了坚实的数学基础。  在机器翻译方面,1933年,苏联发明家特洛扬斯基设计了用机械方法把一种语言翻译为另一种语言的机器,并在同年9月5日登记了他的发明。

内容概要

  《俄罗斯计算机语言与机器翻译》全面阐释了俄罗斯在计算语言学和以机器翻译为代表的信息处理系统研发领域取得的科研成就,以及某些具体语言处理目标的实现策略和技术,这也是本书区别于其他计算语言学著作的一个鲜明特色。

作者简介

  傅兴尚,博士,教授,博士生导师。生于1966年,河北青龙人。主要从事计算语言学、语义学等学科的教学和科研工作。曾受教于黑龙江大学、国立普希金俄语学院、莫斯科国立大学。1998年主持承担教育部人文社会科学“九·五”规划项目《现代俄语事格语法》;2001年主持承担国家社科十·五规划项目《面向信息处理的俄语语言知识库》;2001年获教育部十·五规划重大项目《俄罗斯计算语言学与机器翻译》;2006年获国家社科十一五规划项目《俄语语义模式化及汉化策略研究》。承担省市级项目5项。已出版专著:《现代俄语事格语法》;《基于事格语法的俄语词汇知识库》;《范畴·规则·操作》;发表学术论文30余篇。2003年研制并首推嵌入式俄汉行掌上电脑系统,俄汉通电子词典等系统。  许汉成,1965年5月出生,陕西省汉中市人。俄语语言学博士。先后就读于西安外国语大学、上海外国语大学和黑龙江大学。主要从事俄语语言学、计算语言学研究。现已出版专著《交际·对话·隐含》,发表论文10余篇,参与或主持了数项国家级和部级课题。  易绵竹,1964年3月出生,四川营山人。双博士学位获得者,教授。博士生导师,中国中文信息学会理事。曾受教于南开大学、黑龙江大学、俄罗斯伊尔库茨克国立大学、国立普希金俄语学院等高校,在业师李锡胤先生的学术指导下,研究兴趣转向计算语言学、心理语言学等学科领域。近十多年来,主持或参与数项各类科研课题,在国内外学术期刊或会议文集中发表论文多篇。代表性著作有《模式分析与知识表达论》、《位语法理论与应用》、《计算语言学》和《工程语言学》。

书籍目录

第一章 计算语言学的几个基本问题第一节 计算语言学导言第二节 语言知识的表征第三节 语言模式化第四节 语言自动机的建造及工作原理第五节 俄罗斯计算语言学研究机构第二章 俄语词汇知识库的建造和应用第一节 词和词汇知识库概说第二节 建造词汇知识库的基础和原则第三节 俄语词汇的信息结构第四节 俄语词汇知识库的建造技术第五节 E.等设计的《词汇信息库》概览第三章 俄语形态信息的自动化分析第一节 俄语文本的单元化分析第二节 俄语形态信息的自动化分析第三节 俄语词汇形态信息的统计学习第四章 俄语句法信息的自动化分析第一节 句法自动化分析的几个基本问题第二节 基本构句块及其识别算法第三节 俄语句法结构的模式化描述及操作原理第四节 形容词扩展模式的形式化第五章 俄语语义信息的自动化分析第一节 语义中介语及其计算原理第二节 词汇语义资源及语义分析第三节 意念词典和语义词典第四节 MAMM压模型与语句意义表示第五节 一种基于TM技术的机助翻译系统的语义处理策略第六章 俄语句法语义的一体化分析第一节 引言第二节 B.A.Ty30B的俄语形式化理论第三节 基于函数模型的句法——语义一体化计算第七章 俄语文本信息的自动化处理第一节 文本著作权归属的自动分析第二节 文本功能语体的自动分类第三节 内容分析:概念、类型与方法第八章 语料库语言学第一节 语料库和语料库语言学的概念第二节 语料库的类型第三节 俄语语料库的建造和发展第四节 语料库的标注经验与规范第五节 语料库检索工具的基本功能第六节 小结第九章 俄罗斯机器翻译:历史与现状第一节 机器翻译思想的产生第二节 俄罗斯机器翻译发展历程第三节 机器翻译方法第四节 机器翻译理论流派第五节 俄罗斯机器翻译系统第六节 总结与展望第七节 与UNL接口的机器翻译系统ETAP-3第十章 语言信息处理系统第一节 信息检索系统第二节 基于语义分析的文本自动文摘研究第三节 计算机辅助语言教学若干问题研究参考文献

章节摘录

  当今信息化社会主要有以下几个显著特点:信息存储方式的数字化;信息处理方式的自动化;信息传输方式的网络化;信息应用方式的产业化。语言是信息的主要载体,语言信息的可计算处理成为信息技术研究领域的主流,同时也是举世关注的焦点和热点。语言活动(包括语言交际、语言研究、语言教学、语言翻译等)要现代化,计算机性能要智能化,所以语言学和计算机科学两个学科发展的瓶颈问题是计算语言学,应该说,自然语言处理的实现是语言现代化和计算机智能化的根本保证。  计算语言学是应用语言学的一个分支,指利用计算机科学这一工具、程序、信息组织技术以及信息处理技术对某种条件、场合、领域语言行使的功能进行模式化,也指语言学和其交叉学科中对语言计算模式的诸多应用。(俄语语言百科:计算语言学)可见,计算语言学是植根于语言学、计算机科学与数学等多学科基础上而成长起来的一门新兴的文、理、工交叉学科,它的主要研究内容是自然语言信息处理,也就是人类语言活动中信息成分的发现、提取、存储、加工、转换与传输。作为独立的研究方向,计算语言学包括交际计算模式化、情节结构模式化、文本表示技术、跨语言处理、机器翻译、计算词汇学、计算语法学、计算语义学、语料库语言学、术语学、自动摘要、语音识别与合成等等。狭义上的计算语言学的问题常常和自然语言处理这一应用学科相关联。总之,计算语言学包括所有计算机手段在语言学中的应用。  俄罗斯(包括苏联)曾最早从事以机器翻译为主要目标的自然语言处理研究,有悠久的历史和辉煌的学术传统,不论在理论构架、资源建设、数学建模,实用化信息系统的研发方面都取得了显著的成绩,在国际上有较大影响。   ……

图书封面

图书标签Tags

评论、评分、阅读与下载


    俄罗斯计算语言学与机器翻译 PDF格式下载


用户评论 (总计0条)

 
 

 

250万本中文图书简介、评论、评分,PDF格式免费下载。 第一图书网 手机版

京ICP备13047387号-7