更新时间:2023-12-06 14:44
黑马校对V21是北京黑马飞腾科技有限公司全力开发的新一代校对系统,荣获“中国优秀软件”终身称号并且通过了中国版协校委会的实测鉴定。内含S2版、PS版、Word版、WPS版、小样版、飞腾插件版和PDF插件版等9个全新的校对界面,采用超大规模词库和重点词监控等先进的校对计算技术,在校对质量、校对功能和易用性等方面都有了飞跃性的提高,达到了当前电脑校对软件发展的最高水平,智能技术居于国际领先水平。
首屈一指的大规模专业词库,专业词库词汇量超过8000万条,包括物理、数学、机械、纺织、气象、历史、考古、文物、交通、邮电、环境、农林牧渔、化学、石化、冶金、煤炭、建筑、水利、图书、印刷、医学、生物、心理、经济、证券、会计、财政、审计、电脑、电子、电力、新闻、政治、哲学、教育、少儿、文学、戏曲、电影、广电、法律、宗教、民族、军事、航空、地理、地质等79个专业词库。覆盖1000亿字高质量语料。符合全国科学技术名词审定委员会的标准。
根据需求定制重点词监控词库,能够准确快速地校对出所有与重点词相似的错误,支持大容量的重点词监控库。特别适合于检查领导人姓名、单位名称、地名以及涉及中央重要精神的词语等。
⑴ 《现代汉语词典》第7版 (商务印书馆)
⑵ 全国科学技术名词审定委员会审定的各科科技名词全书
⑶ 《中国人名地名大辞典》
⑷ 《第一批异形词整理表说明》 (语文出版社) 国家语委2002年3月颁布
⑹ 《中国成语大词典》 (上海辞书出版社)
⑺ 《使用语言文字规范指南》 (上海辞书出版社)
⑻ 《外国地名译名手册》(中型本) 中国地名委员会编 (商务印书馆)
⑼ 《英语姓名译名手册》第四版 新华通讯译名资料组 编 (商务印书馆)
自由定义用户库、错误库、重点词监控库、敏感库、建议库、领导人职务库和排序库等词库,量身打造校对标准。可以自由挂接外来词库。
S2版可同步校对大样和小样文件,能够直接对照大样文件无损修改小样文件。
方便实用的生成勘误表功能。
强大的批量查找功能,辅助校对和建立索引。
句库匹配,轻松校对文中引语是否与原句匹配。
高效的提取生词功能,轻松扩建用户词库。
先进的大样转文本和小样排版符号剥离工具。
严格审定的大型成语查询库和各类知识库。
1. 正向查错
依靠语言模型来进行汉语依存关系分析 ,也就是对大量分类语料中的上下文和语句关系进行量化的统计、分析、提炼,并采用高倍信息压缩、快速检索、汉字高精度快速切分等先进技术 来生成语言模型和依存分析算法。
语言模型中知识库词条达4800万条之多。
为提炼不同领域的文字特征,黑马分析处理了涵盖自然科学、社会科学十大分支的300亿汉语语料,同时鉴于中文的复杂性,为了提高语言模版的准确性和减少信息垃圾,我们每年投入30余名数据处理人员对计算机智能分析结果进行人工核查。
2. 反向查错
黑马公司长期坚持不懈地大量收集各种常见错误,包括:写作人员似是而非错误、五笔字型录入人员常见错误、拼音录入常见错误、OCR识别有规律的错误、各专业废除词条、不规范科技计量单位、国家语委确定的非规范词条 、各类政治性错误等。
3. 从实际需求出发,增强校对功能
黑马校对软件不仅在核心技术上保持着领先地位,而且还针对广大用户的实际使用地改进版本,扩大软件的适应性,使其更具实用价值。
黑马校对系统的早期版本可以校对各种排版格式的小样文件,后来为方便校对人员对稿,增加了把大样文件转换成文件文件,保留页码信息的功能。后来,黑马公司研制出软件RIP技术,开发了可以直接显示并校对大样文件的S2版和PS版。为了方便编辑、排版人员的校对和修改,开发出了嵌入到Word中校对的Word版、嵌入到WPS中的WPS版、嵌入到Acrobat中的PDF版和嵌入方正飞腾等排版系统的飞腾插件版。
黑马校对V21版内含800万条错误规则库和8000万条专业库,具有强大的查错能力,能够精确校对政治性问题(领导人姓名、职务、排序,台湾问题,敏感词语等)、中文(错别字、少字、多字、词语搭配和部分语法语义、异形词和繁体字、“也作”和曾用词、知识性错误、人名、地名等各种错误)、英文拼写、标点、数字、科技计量单位、重句等各种错误,部分校对界面(S2版)还可以校对目录、标题和序号等错误。
下面列举一些黑马校对可以检查的错误类型(括号外为错误词条):
2022年9月,黑马校对V30版本正式上线。该版本解决了黑马校对与WPS软件的融合问题,适配各种校对场景,支持校对多种错误形式。