Цифровое Средневековье: Проблема старых форматов
В национальном архиве Великобритании хранится более 580 терабайт данных — в 580 тыс. раз больше, чем в средней многотомной энциклопедии. Большая часть из них представлена в устаревших, давно не использующихся форматах. Сейчас их еще можно прочитать без особенных проблем, хотя и для этого подойдет далеко не каждый компьютер. Спрашивается, что будет с этими данными через десяток-другой лет?
Поясняет архивист Натали Кини (Natalie Ceeney): «Положив на полку бумажный материал, вы можете быть уверены в том, что он будет вполне доступен для прочтения и спустя сотни лет. В случае цифрового носителя — флоппи-диска, например — у нас нет никакой уверенности в том, что его содержимое можно будет считать через 3−4 года, когда компьютеры снова обновятся. По сути, цифровая информация оказывается гораздо более уязвимой и эфемерной, нежели простой рукописный текст».
По ее мнению, когда речь идет о сохранении информации, высокий темп развития компьютерных технологий выступает не безусловным благом, но бомбой замедленного действия. В один прекрасный момент человечество может потерять огромное количество накопленных данных просто потому, что формат, в котором они записаны, успел безнадежно устареть. «Мы постоянно сталкиваемся с подобными случаями в своей практике — счет потерь уже очень велик, — отмечает Натали Гриней — Человечество просто обязано что-то предпринять — иначе нас ждет "цифровое Средневековье"".
Ситуация усугубляется тем, что цифровых форматов существует очень много — значительно больше, чем диктует объективная необходимость, а также тем, что форматы эти непрерывно «воюют» друг с другом. Крупные производители стараются навязать сообществу именно свои форматы, стремясь укрепить позиции на рынке. Если тот или иной формат был полностью вытеснен более удачливым конкурентом, его поддержка не будет включаться в новые версии программ, и следовательно через несколько лет он станет фактически недоступен для прочтения.
«Срок в 15 лет оказывается целой эпохой, если речь идет о цифровых технологиях. За это время сменилось пять поколений компьютеров. В этих условиях сохранить информацию без потерь представляется крайне сложной задачей» — замечает Адам Фаркуар (Adam Farquhar), руководитель электронного отдела Британской библиотеки.
Проблема устаревания форматов не имеет простого решения, однако над ней надо работать — с этим согласны как архивисты, так и компьютерные эксперты. Британский архив в сотрудничестве с Microsoft разрабатывает программную среду, которая позволит читать и редактировать файлы любых форматов, использовавшихся в различных версиях Microsoft Office. Что существенно, редактирование происходит без конвертирования информации из одного формата в другой, сопряженного с некоторыми потерями. Вероятно, человечеству стоило бы договориться об использовании единых форматов для разных типов документов, однако эта перспектива остается более чем туманной. До тех пор остается пользоваться программами автоматического распознавания и конвертирования старых форматов — несмотря на то, что подобные системы отнюдь не способствуют решению самой проблемы, скорее наоборот.
Об эволюции цифровых носителей памяти читайте: «Товарищ память». Кстати, нынешний год — последний для флоппи-дисков в широкой продаже — читайте: «Прощай, дискета».
По публикации BBC News