更新时间:2023-04-28 21:45
北京大学计算语言学研究所成立于1986年。研究所的使命是致力于计算语言学理论、语言信息处理的基础资源和应用技术三方面的研究,同时也承担培养计算机软件与理论专业、语言学专业的博士研究生和硕士研究生的任务。自成立以来,一直保持了文理结合、多学科交叉的学术风格和研究特色(计算机科学、语言学、信息技术、数学与统计学),已形成系列化的研究方向和人才优势。
北京大学计算语言学研究所 简称:北大计算语言所 英文名称:Institute of Computational Linguistics (ICL), Peking University;研究所成立18年来所取得的一系列成果在国内外学术界和产业界产生了广泛的影响并取得显著的效益,2004年研究所工作人员包括在职研究人员和博士后研究人员18名,其中14名有博士学位、教授4名、副教授6名,同时还有在读博士和硕士研究生30多名、本科实习生10余名。
著名语言学家、前北京大学副校长朱德熙先生担任了研究所第一任所长。计算机系俞士汶教授长期担任了研究所常务副所长,中文系陆俭明教任所副所长。计算语言研究所挂靠在北京大学信息科学技术学院,现任所长由北大信息与工程科学学部主任、中国科学院院士杨芙清教授兼任;日常工作由常务副所长孙斌博士、副所长王厚峰博士和副所长詹卫东博士(中文系)负责。研究的主要的方向
基础资源的研究与建设
计算词典学与机器词典,综合型语言知识库,语料库语言学与语料库加工技术,术语学、术语自动提取、术语标准化研究等。
基础理论、NLP的模型和方法
计算语言学基础,自然语言处理核心技术,现代汉语语法,汉语的词/句法/语义分析,NLP统计模型,语言处理的信息论方法等。
基础应用技术
机器翻译的方法、技术与系统实现,信息检索与提取,自然语言信息处理系统的评价方法和技术,受限汉语及其辅助写作系统,中国古诗词计算机辅助研究等。
■语言模型与分析技术
■语料库语言学
■信息检索与提取的模型与系统
■计算语义学
■自然语言处理系统评价技术
■计算词典学
■机器翻译的理论、技术与系统实现
■术语学与术语标准化
■中国古诗词计算机辅助研究
■受限汉语及其辅助写作系统
计算语言学研究所在计算机系开设了《计算语言学》、《自然语言处理技术》等研究生课程,出版教材《计算语言学概论》。已培养获得博士学位研究生10名、获得硕士学位的研究生10余名、博士后工作人员近10名,接待国外访问学者3名,国内访问学者7名。
研究所承担和完成的项目包括国家重点基础研究发展规划(973)项目、国家高技术研究发展计划(863)、国家自然科学基金项目、教育部教专项资助项目、国家社科研究规划项目、国家语言文字应用研究科研项目、国家质检局中国标准研究院项目、大百科全书出版社合作项目、IBM-北大创新研究院项目以及北大985项目等三十多项。
■综合型语言知识库(包括:现代汉语语法信息词典、大规模标注语料库、面向机器翻译的语义词典和面向信息检索与信息提取的中文概念词典等)已初具规模,在语言信息处理界发挥了作用。
■中文自动切分与词性标注、中文自动注音、汉英机器翻译(合作)、古诗词计算机辅助研究和中文信息提取等工具软件或应用系统有一定影响。已经取得了属于国家科技攻关、国家自然科学基金、“863”高技术项目的“机器翻译译文质量评估软件”、“日汉机器翻译系统”(合作)、“机器翻译与自然语言处理的自动评价”等成果。
■计算语言所的科究成果获得政府部委级与北京大学的多项奖励,部分成果已传播到世界各地,如美国、日本、德国、法国、韩国、新加坡、瑞典以及香港、台湾和内地等。Microsoft、IBM、Xerox、Intel、Fujitsu、NTT、松下、Saillabs、Enpia、佳能、东芝、NEC、青鸟、联想、北佳等50余家国内外大公司和研究机构从北大购买了科研成果许可使用权,或者同北大计算语言所共享合作研究成果。
■北大计算语言学研究所同国内主要研究机构以及港、台、新加坡、欧美等地区的大学和公司建立了广泛密切的学术联系,已成为具有广泛影响的语言信息处理研究基地。
自然语言信息处理研究任重道远。北大计算语言所正努力进行资源、理论和应用方面的探索,寻找发展契机和突破口,并坚持理论探讨同大规模语言工程实践相结合,强调语言知识表示的整体性和理论应用的针对性。北大计算语言所兼收并蓄国内外计算语言学研究的新思想与新方法,并紧密结合汉语的特点提出适合汉语信息处理的综合型语言知识库的构建计划。北京大学计算语言学研究所期望与同行一道攻关,密切协作,把语言信息处理研究推向新的高峰。