Рукопись Войнича: Текст на неизвестном языке или мистификация?
Рукопись Войнича — книга из 104 листов, каждая страница которой заполнена графемами (группами символов) и иллюстрациями. Впервые о ней стало известно в 1912 году, когда Вильфред Войнич объявил, что обнаружил ее на вилле Мондрагоне в Италии. Графемы рукописи оказались знаками, не встречающимися ни в одном из известных языков. С момента обнаружения рукописи исследователи пытаются определить, написан ли ее текст на каком-то неизвестном языке, или является мистификацией — бессмысленным набором ничего не значащих символов. Дополнительную загадочность рукописи придают иллюстрации — изображения растений, ни одно из которых не встречается в природе. По данным радиоуглеродного анализа рукопись могла быть создана в начале XV века, но доказательств, того, что она была написана именно в это время, не найдено. Существует версия, что рукопись является искусной подделкой, выполненной самим Войничем.
Для проведения компьютерного анализа рукописи ученые сначала перекодировали ее, обозначив символы рукописи буквами латинского алфавита. Затем они исследовали характер распределения в рукописи «слов» — групп символов, разделенных пробелами и линиями. С помощью статистических методов были выделены наиболее информативные слова и построена кривая зависимости среднего количества информации, приходящейся на одно слово, от протяженности текстового фрагмента. Такая зависимость, как утверждают исследователи, имеет в разных языках характерную точку экстремума, соответствующую некоторой «оптимальной» длине текстового фрагмента.
Для языка рукописи Войнича оптимальная длина текстового фрагмента составила 805 слов. Полученные с помощью того же алгоритма оценки оптимальных длин текстов на английском и китайском языках составили 728 и 580 слов. Участки кода ДНК дрожжей и исходные тексты программ на языке Фортран имеют оптимальную длину в 25 и 285 слов соответственно. По этому критерию текст рукописи Войнича оказался очень близок к естественным языкам.
Кроме этого исследователи отметили, что распределение частоты слов в рукописи подчиняется закону Ципфа — эмпирической закономерности, также характерной для естественных языков.
На основании полученных результатов ученые пришли к выводу о маловероятности того, что рукопись Войнича является мистификацией.