Рукопись Войнича — книга из 104 листов, каждая страница которой заполнена графемами (группами символов) и иллюстрациями. Впервые о ней стало известно в 1912 году, когда Вильфред Войнич объявил, что обнаружил ее на вилле Мондрагоне в Италии. Графемы рукописи оказались знаками, не встречающимися ни в одном из известных языков. С момента обнаружения рукописи исследователи пытаются определить, написан ли ее текст на каком-то неизвестном языке, или является мистификацией — бессмысленным набором ничего не значащих символов. Дополнительную загадочность рукописи придают иллюстрации — изображения растений, ни одно из которых не встречается в природе. По данным радиоуглеродного анализа рукопись могла быть создана в начале XV века, но доказательств, того, что она была написана именно в это время, не найдено. Существует версия, что рукопись является искусной подделкой, выполненной самим Войничем.
Рукопись Войнича: Текст на неизвестном языке или мистификация?

Для проведения компьютерного анализа рукописи ученые сначала перекодировали ее, обозначив символы рукописи буквами латинского алфавита. Затем они исследовали характер распределения в рукописи «слов» — групп символов, разделенных пробелами и линиями. С помощью статистических методов были выделены наиболее информативные слова и построена кривая зависимости среднего количества информации, приходящейся на одно слово, от протяженности текстового фрагмента. Такая зависимость, как утверждают исследователи, имеет в разных языках характерную точку экстремума, соответствующую некоторой «оптимальной» длине текстового фрагмента.
Для языка рукописи Войнича оптимальная длина текстового фрагмента составила 805 слов. Полученные с помощью того же алгоритма оценки оптимальных длин текстов на английском и китайском языках составили 728 и 580 слов. Участки кода ДНК дрожжей и исходные тексты программ на языке Фортран имеют оптимальную длину в 25 и 285 слов соответственно. По этому критерию текст рукописи Войнича оказался очень близок к естественным языкам.
Кроме этого исследователи отметили, что распределение частоты слов в рукописи подчиняется закону Ципфа — эмпирической закономерности, также характерной для естественных языков.
На основании полученных результатов ученые пришли к выводу о маловероятности того, что рукопись Войнича является мистификацией.