更新时间:2024-09-22 05:22
伏尼契手稿(Voynich manuscript),是一本内容不明的神秘书籍,共240页,附有插图,而作者不详。书中所用字母及语言无人能识别,与现代的语言完全搭不上,似乎是中古世纪炼金术士之参考书籍。书名伏尼契来自名为威尔弗雷德·伏尼契的波兰裔美国人书商,他于1912年在意大利买下此书。2005年,这部书入藏耶鲁大学的贝内克珍本与手稿图书馆,编号MS 408。
1912 年,美国珍本书商威尔弗雷德·伏尼契(Wilfrid Voynich)在罗马附近一所耶稣会大学图书馆的地下,找到他一生中最大的发现:一份厚达230多页,以奇特字体写成的手稿,手稿中还有许多植物、天体和出浴美女等奇异的图片。伏尼契立刻认定这是极为重要的新发现。这份手稿虽然看来像是中世纪炼金术士或草药医生的参考书,但似乎完全以密码写成。从插图中的发型等特征看来,这本书的制作时间应该介于1470~1500年间,手稿上的信中的17世纪字母说明,这份手稿在1586年由神圣罗马帝国的鲁道夫二世收购。 1600年代,至少有十位学者曾试图解读这份手稿,后来它消失了将近250年,直到被书商伏尼契发现才重见天日。
伏尼契敦请当时顶尖的密码学家破解这份奇特的手稿,但它似乎和任何已知的密码语言都对不起来。90年来,许多世界顶尖的译码专家努力钻研,但是没有人能破解这种称为“伏尼契文”的文字,这份手稿的真面目和来源仍是个谜。一连串的失败令伏尼契手稿俨然成为密码术历史中的圣杯,让人怀疑手稿是否有内容可供破解。伏尼契文说不定完全没有意义,手稿也可能只是个精心设计的骗局。
这份手稿目前收藏在美国耶鲁大学贝内克珍本书与手稿图书馆中。
由右边不对称的段落推断,文字是由左至右书写。段落没有明显的标点符号。从流畅的字型及排列整齐,似乎誊写员清楚明白自己在写什么,而不是落笔前故意逐字编造。
手稿含有17万个字迹,字迹之间有窄分隔,大部分由一至两笔写成。一套有20至30种不同字迹的字母系统几乎说明了整个手稿。关于某些字迹是否为个别字母存在一些争论。部分奇怪的字母仅出现一或两次。较阔的分隔可分辨出约3.5万个不同长度的“词汇”,大致符合语音学的规律,例如部分字母在每一个词汇经常出现(正如英语的元音字母)等。
统计分析发现,文稿的文字规律与自然语言类似。例如,词汇的出现频率符合齐夫定律,而词汇的熵(每词约10位元)亦与英语或拉丁语相类似。
然而,手稿的语言与欧洲语言不太相似。例如,几乎没有词汇是多过10个字母,亦几乎没有1或2个字母的词汇。词汇内的字母分布独特,有些字母仅出现在字首,有些在字尾,有些在词汇中间,这特点与阿拉伯字母相似,但不见于拉丁字母、希腊字母或西里尔字母。词汇的重复程度也高于一般欧洲语言。同一词汇可能一气出现三次(相当于在英语出现and and and)。统计学上,手稿的词汇数目相对较少。
它曾经难倒过许多20世纪顶尖的密码学家。美国的密码破译之父——赫伯特·奥斯本·亚德利曾在一战期间破解过德国人和日本人的密码,却对这份手稿束手无策。破解密码的关键在于找到其中的“破绽”,它是泄露天机的规则。难以置信,在伏尼契密码面前,各种语言的统计规律统统失效。
威尼斯的弗朗切斯科家族从威尼斯建城伊始就从事商业政治与学术。弗朗切斯科·达·莫斯托是一名威尼斯著名的建筑学家和历史学家,他对手稿中的图画提出了自己的看法:“这是一个容器,这有点特别,这种材料不像是金属,很脆弱但你可以随意摆弄它,没错,这有点像玻璃。” “容器的底座像是那个时期的威尼斯玻璃。制作玻璃有很多秘方,在当时,没有人可以把这些秘方泄漏出去:玻璃的制作过程所用的材料组成部门都有很严格的规定,泄漏出去会遭到严厉的惩罚。” “有些人去了法国,威尼斯共和国就写信给他们说:‘如果你泄漏了秘密,你的家人就会有大麻烦,或者我们会杀了你。’ ”
弗朗切斯科认为伏尼契手稿的作者是中世纪的商业间谍,窃取并贩卖威尼斯人的商业秘密,为隐瞒意图用似乎无法破解的密码书写了这份手稿。
罗莎·曼塔斯蒂是威尼斯早期玻璃专家,在穆拉诺玻璃博物馆的保管室里存有一些文艺复兴时期的玻璃,手稿中的图画似乎与它们遥相呼应。
密码学家约翰·查德威克认为,密码学的核心在于演绎和控制试验,“形成假说,进行检验,频繁地抛弃假说”。如何向他人证明某种破译方案是正确的,也并非易事,它需要密码破译者提供4个步骤:其一:指出密码系统及其密钥;续而:针对密文进行加密过程的逆过程,得出待检验的明文;其三:确保明文是有意义的信息,而非胡言乱语;最后:密钥可以简洁地表达。
对于试图破译《伏尼契手稿》的人而言,上述4个步骤是无法逾越的屏障。英国基尔大学高级讲师、知识建模小组组长,开放大学高级客座研究员戈登·鲁格宣布,《伏尼契手稿》是一场精妙绝伦的骗局,首要嫌犯是伊丽莎白女王的一名律师,他可能是利用一种“卡登格”,把字母等符号写在方格里,然后用一张有着规则的孔的卡片盖住,把从孔中露出的符号拼凑起来造出假冒的“单词”。
密码专家菲利普·辛纳格拉认为手稿的密码系统与复兴时期米兰的某个系统相似,强大的斯福尔扎家族曾经使用过这个密码系统。”这是米兰斯福尔家族的密码索引,上面是密码字母。我们发现4所代表的是C,40代表是S,伏尼契手稿里也有这个密码,符号相同,4和40(注:读作四零)。”
“世界上圆形的城镇共有9个,我能想起的一个是巴格达,一个是耶路撒冷,米兰也是圆的。如果这是一座城市中间就是有塔的城堡还有相当独特的V型的城垛。”米兰的城垛也是V形的。
15世纪的米兰非常强大,常常与邻近的威尼斯大动干戈。它由强大的斯福尔扎王朝统治。在米兰的中心正是斯福尔扎的城堡。如今斯福尔扎里的菲拉雷特塔已经成为米兰的地标,它与手稿中图画十分相似。在十九世纪重建以前,城堡最古老的部分是一座独立的V形城堡,它立在护城河的中央,守候着城堡。
菲拉雷特塔以建筑师安东尼奥·阿维利诺的名字命名,他的名字绰号为“菲拉雷特”意为“崇尚美德的人”。
公元1400左右,阿维利诺生于佛罗伦萨,后经培训成为一名建筑师,他在罗马居住过一段时期,因为被控参与盗窃施洗者圣约翰的头颅的行动而入狱,出狱后他逃到威尼斯然后前往米兰。
他最大的成就不是建筑而是一本书,名为“建筑论文”,他在书中描述了自己想像中的理想城市,在1465年完成,他在书中使用大量的密码和暗语,这也成为他是伏尼契手稿作者的重要依据。
弗朗切斯科这样大笑着评论说:“他把灵魂卖给了魔鬼!”
(注:关于建筑师安东尼奥·阿维利诺。他在米兰工作了十五年,设计了 菲拉雷特塔,和他最大的成就之一——曾学习过密码。)
1921年,出现了第一个宣称破解伏尼契手稿的人。美国宾州大学哲学教授纽柏德指出,伏尼契文字的字母中包含放大后才看得见的小笔画,这些笔画是古希腊速记文字。依据由密码读出的内容,纽柏德断定伏尼契手稿是13世纪的哲学科学家培根(Roger Bacon)所撰写,旨在描述他的发现,例如显微镜的发明等。但不到10年,批评者就推翻了纽柏德的说法,证明所谓字母中的细小笔画其实是墨水的自然裂痕。
纽柏德的努力只是一连串失败的开始。1940年代,业余的解码家菲利和史壮运用密码代换法,将伏尼契文字母转译成罗马字母,但如此转译出来的文字没什么意义。二次世界大战末期,曾破解日本海军密码的美国军方密码人员,利用闲暇研究古代密文。他们破解了所有密文,唯一无法破解的就是伏尼契手稿。
1978年,业余文献研究者史托济科指出,这种文字是以去掉元音的乌克兰文写成,不过他转译出来的内容(包括「小上帝的眼睛要争夺的是空虚」)并不符合手稿上的插图,跟乌克兰历史也没什么关系。1987年,医师利瓦伊托夫指出,这份文件由在中世纪法国相当盛行的净化派(Cathar)信徒所制作,伏尼契文则是多种语言的混合体。不过利瓦伊托夫译写出来的内容也和净化派完整保存的教义不相符合。
此外,这些解答方案在碰到相同的伏尼契字时,往往在手稿中某些部份用的是一种翻译,在其它部份用的又是另一种翻译。举例来说,纽柏德的解答中包含以回文方式解译文字,这种方式是出了名的不精确。例如ADER这字就可以看成READ、DARE或DEAR。大多数学者认为,这些伏尼契手稿破解方法多少都有令人无法信服的地方。另外,这些方法都无法将明文(看得懂的文字)转译成与伏尼契文特性相同的密文。如果手稿不是密码,那么会是一种不为人知的文字吗?虽然我们无法解译内容,但看得出它具有惊人的规则性。举例来说,最常见的一些字每行会出现两三次。在写出文字时,我使用欧洲伏尼契字母(EVA)将伏尼契文转写成罗马字母(请参见右页〈伏尼契文ABC〉)。手稿第78页有一段是这样的:qokedy qokedy dal qokedy qokedy。这种重复程度在任何已知语言中都不曾出现。相反地,伏尼契文中只有极少数词组,在词组中,两三个不同的字会规律地一起出现。这些特征显示伏尼契文不大可能是人类语言,因为和其它语言差别实在太大了。
第三种可能是,这份手稿是用来诈财的骗局,或是某个疯狂炼金术士的信手涂鸦。手稿在语言学上的复杂程度,似乎可以反驳这种说法。手稿中的文字,除了会重复出现,其本身的组成结构也有相当的规律性。例如经常出现的音节qo一定位于前缀。chek这个音节有时会出现在前缀,但如果和qo出现在同一个字中,chek一定会在qo之后。常见的音节dy通常出现在字尾,偶尔会出现在前缀,但从来没有出现在字的中间。
光靠随机混合音节的假造方式,不可能产生规律性这么高的文字。伏尼契文也比脑部损伤或有心理疾病的患者所使用的病态语言复杂得多。即使发疯的炼金术士真的为某种胡诌的语言制订了文法,又花了好几年时间依据这种文法写作,写出的东西也不会具备伏尼契手稿的各种统计特征。举例来说,伏尼契文的文字长度呈现二项分布,也就是最常见的字由5~6个字母组成,字母较多或较少的字,出现的频率和对称钟形曲线的最高峰相比,大幅降低。这种分布在人类语言中极为罕见。在绝大多数人类语言中,字长的分布较广而且不对称,比较长的字出现频率会比较高。伏尼契文字长度的二项分布,不太可能是骗子刻意编造出来的,因为这种统计概念要到手稿写就后数百年才会出现。
总而言之,伏尼契手稿若不是极为罕见的密码或奇怪的未知文字,就是个精心设计的骗局,以往一直没有明确的方法可以打开僵局。刚好几年前,我同事海德和我正在寻找这样的谜团。我们发展出一种深入的评估方法,用来分析与探讨在研究难题时使用的专门知识和推理过程。
认为伏尼契文的特征与人类语言不一致的说法,有大量的语言学相关专门知识做为后盾。这个结论看来相当可靠,因此我进一步研究骗局说。大多数研究过伏尼契手稿的人认为伏尼契文十分复杂,不可能是骗局。但这种说法只是单纯的想法,没有实际证据。没有专家研究过如何摹写大段中世纪密文,因为要找到真实文字的实例都不容易,想要找出假造的文字就更难了。
几位研究人员,包括巴西坎皮纳斯大学的史托非等,曾经怀疑伏尼契手稿是以随机文字产生表制作出来的。这种表中列出了字母或音节,使用者选择一连串格子(可能是掷骰子决定),将格子中的字母或音节组合成一个字。这种方法可能产生伏尼契文字中的某些规则性。在史托非的方法中,表中第一栏是qo等只会出现在前缀的前缀音节,第二栏是chek等中缀(出现在字中间)音节,第三栏为y等后缀音节。依序从每栏选出一个音节,就可造出具伏尼契文特征的字。某些格子可能是空的,这样就可以造出没有前缀、中缀或后缀的字。
不过伏尼契文的其它特征就没这么容易仿造了。举例来说,有些字母很常见,但极少连在一起。转写为a、e、l的字母很常见,al的组合也常见,但el的组合就很少。透过表格随机混合字母无法做出这种效果,因此史托非等人排除了这种方法。真正的关键是“随机”。对现代的研究人员而言,随机是非常宝贵的概念。但手稿写成之后过了很久,这种概念才发展出来。中世纪的骗子很可能用不同的方法来组合音节,而这种方法在严格的统计定义上不是随机的。伏尼契文某些特征可能是以一种早已弃而不用的工具所造成的。此书的标题无人理解,便干脆以伏尼契,一位波兰籍科学家兼藏书家的名字命名,他同时是小说《牛虻》的作者的丈夫。1912年,伏尼契在罗马附近一所耶稣会大学图书馆找到了这份手稿,它在消失将近250年后重见天日。此书大约出现于15世纪末期,曾被神圣罗马帝国皇帝鲁道夫二世以相当于今天8万美元的价钱收购。
反对这个说法的人士则主张,伏尼契文如此复杂,不可能毫无意义。一个中世纪的骗子怎么可能伪造出230页的文字,而且结构和文字的分布又有许多精微的规律呢?但有人发现,只要利用一种16世纪常见的简单编码工具,就可仿造出许多伏尼契文的特征。用这种方式制作出来的文字看起来相当接近伏尼契文,但是完全没有意义,也没有任何隐含的讯息。这个发现并不能证明伏尼契手稿是个骗局,但确实支持了一个存在已久的说法:英国冒险家凯利假造这份文件,用来诈骗鲁道夫二世。据说这个皇帝总共花了600达卡特金币(相当于今天的八万美元)买下这份手稿。
于是,在各种猜测中,不可避免地出现了这种声音:“手稿根本就是伪造的,那只是一堆毫无意义的符号。
”如何鉴别一组符号是否包含信息,是知识研究中最令人头疼的问题之一,尽管如此,还是能找到鉴别的办法。
密码学家通常依赖对语言的统计分析。在真正的密码中,字母被符号替代,某些字母组成的“对”应该比其他的“对”更常见,比如在英语中,“th”和“is”是很常见的组合,而“q”后面几乎总是跟着“u”。反过来,有些字母对则相对罕见,如“c”和“d”很常见,但是“cd”组合就很难看到。科学研究认为,这些原理提供了一种鉴别密码真伪的方法。
通过对伏尼契手稿的详细审查,密码学家发现它具备与真实语言非常相似的统计模式。字母或其他符号在文本中的重复程度可用一个统计量“熵”来表示。手稿中的每个字母对应的熵与波利尼西亚语大致吻合。人类的大脑不可能创造出真正的随机性,而伏尼契密码比任何已知的欧洲语言更少随机性,比大多数自然语言更有规则。
威廉姆·庞德斯通曾经有两部著作获得普利策奖提名,他在“令人眼花缭乱”的力作《推理的迷宫》一书中认为,这是支持伏尼契手稿是真正的密码的有力证据,他很难相信,“一部赝品能做得如此精密,竟然骗过了语言统计学”。
在种种加密方案中,有一种因罗马皇帝使用而得名的“恺撒密码”,即一个字母始终用某个字母替换。破译者可以通过识别出最常见的几个字母而轻易破解。恺撒密码共有26种,如果在一份密文中对每一个字母应用不同的恺撒密码,就可以设计出不可破解的密码,即“一次性便笺密码”。
庞德斯通假设《伏尼契手稿》原文是一种基于罗马字母的欧洲语言,其中每个符号对应一个字母,加密方法就是一次性便笺密码。在无法得到“密钥”的情况下,他试着用“暴力法”来检验手稿可能采用的所有加密方案。结果行不通。因为,对于每一个字母都需要检验26种可能性,如果样本包括100个符号,则需要考虑26的100次方种可能性,这个任务无法完成。
更复杂的情况在于,也许伏尼契手稿还采用了除恺撒密码之外的加密方式,因为有很多办法可以把字母转化成符号。
英国贝德福德大学应用语言学教授Stephen Bax近期声称,他成功破译了部分《伏尼契手稿(Voynich manuscript)》,成为历史上第一位破译该手稿的语言学家。在此之前,唯一能破解这600年以来最难的一本书的人只有印第安纳·琼斯(电影《夺宝奇兵》中主人公)。
这本闻名世界的手稿中有很多奇株异草、星体和神秘人像的插图,并著有大量未知文字。它被视为世界上最神秘的书籍。
《印第安纳·琼斯》三部曲中,印第安纳破解了《伏尼契手稿》,并利用书中信息找到了“贤者之石”。但在现实世界中,这本15世纪的神秘书籍难倒了一众学者,密码员和破译专家绞尽脑汁都无法解开手稿中任何一个词,甚至是一个字符。
Bax教授参考了中世纪各类手稿,并运用闪米特语系中的阿拉伯语来破译《伏尼契手稿》的神秘含义。他结合严谨的语言分析,逐个字符推敲,现在已经破译了17个象征符号,揭示出了10个单词的意思。Bax教授声称,他破译出了包括杜松(juniper)、芫荽、鹿食草 (hellebore)、黑枯茗(Nigella Sativa)、棉花(cotton)和藏红花(saffron)等植物名词,以及希腊神话中半人马的名字喀戎(Chiron)。
Bax教授说:“我不认为这本书来自外星球或是什么魔法师的杰作诸如此类的。我想它本质上就是一本关于大自然的书,不然怎么会画满了植物和各类星体。我破译的第一个单词是‘金牛座(Taurus)’,单词旁边有一幅七星图。这七星图画的是金牛座里的一个叫昂宿星的星团。人们很早就猜到‘金牛座’这个词,我再结合有关手稿方面的知识,几乎可以确定它就是‘金牛座’;以此类推又发现了17处可解的地方,得出了10个单词。我用以阿拉伯文和其他语言文字记载的中世纪药草手稿来破解那些图形,它们中很多都指向植物类,而且会是你意想不到的种类。我觉得,这手稿源自亚洲,因为如果是欧洲的,那我们肯定能窥解一二。手稿上的语言至今仍未被鉴定出来,它是独一无二的,写法很淘气,像来自中土世界。”
他补充道:“我做这一切完全是出于对语言和语言学的喜爱,它对我而言是一个终极挑战。我把目前的研究结果报告出来是为了鼓励其他语言学家能和我一起用这个方法破译整本手稿。此去任重道远,但继续走下去我们一定会弄明白手稿作者到底想告诉我们些什么东西。而我的研究结果也已明确肯定,《伏尼契手稿》并不像某些人所说的只是一场恶作剧。”
用破译“金牛座”的方法,Bax教授还解得了一个新词“kantairon”,这是中世纪知名药草矢车菊(Centaury)的另一个叫法。
虽然Bax教授破解的只是手稿中很小的一部分,但在破译界和语言学界都引起了极大回响,他的研究发现对将来全面破解整本《伏尼契手稿》的工作至关重要。
据悉,《伏尼契手稿》最初由一名叫Wilfred Voynich的书商于1912年在一个意大利修道院中发现。早前研究伏尼契手稿的学者推测其发源地是欧洲,但美国特拉华州立大学植物学教授Arthur
Tucker在2月发表言论,否认了这一推测。他强调,书中303种植物中至少有37种生长于中美洲,也就是现在的墨西哥一带。手稿写于15至16世纪,那么很有可能使用的是纳瓦特族(墨西哥南部和中美洲印第安各族)的纳瓦特语。
来自University of Alberta的Greg Kondrak和他的研究生Bradley Hauer宣称,运用人工智能,他们已经找到了破译“伏尼契手稿”的线索。 随着科技的发展,人工智能已被运用到破解伏尼契手稿中,并成功破解部分加密信息。相信人工智能会带来更多的发现。
有人认为伏尼契手稿只是文字显得很复杂的骗局。但另一方面质疑如果是骗局,随之而来的问题:作者为什么会采用这样一个复杂而艰苦的骗局,如果没有一个预期的观众(即创作者的同时代人)?但有人认为,当初这手稿疑似被神圣罗马帝国皇帝鲁道夫二世买下,显然作者是以精美的图,运用卡登格填上文字来骗钱。