Типичная Лена и другие стандарты

За что программисты и разработчики особенно ценят кроликов, драконов и шведскую модель Playboy Лену Седерберг.
Типичная Лена и другие стандарты

От моделей Playboy до китайских драконов: самые знаменитые тестовые объекты в программировании, 3D-моделировании, сжатии и безопасности.


Спортивные соревнования помогают найти тех, кто быстрее, выше, сильнее прочих людей. Атлеты стараются первыми пробежать нужную дистанцию, перепрыгнуть самый высокий барьер, поднять самую тяжелую штангу. Такие испытания существуют и для компьютеров – стандартные тестовые модели и файлы, на которых программисты проверяют работоспособность своих алгоритмов.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Стандартная Лена

Разработчики, создававшие первые алгоритмы обработки изображений, регулярно брали подходящие картинки, которые первыми попадали им под руку. Вряд ли удивительно, что среди них регулярно попадались номера журнала Playboy. Первый задокументированный случай такого использования относится к плейбой-модели Тедди Смит, снимки которой фигурировали в работе по дизерингу изображений 1961 г. Но самой знаменитой из таких картинок оказалась фотография шведской модели Лены Седерберг, опубликованная в Playboy в 1972 г. и уже в следующем году использованная Александром Савчуком, тогда – профессором Университета Южной Калифорнии.

К концу XX в. Лена стала одним из самых распространенных изображений на страницах профессиональной прессы, в одном номере авторитетного журнала IEEE Transactions on Image Processing за 1999 г. она появлялась сразу три раза. Успех картинки связывают не столько с привлекательностью модели, сколько с удачным сочетанием характеристик: множеству тонких деталей, сложных линий, полутонов, теней позволяет лучше отслеживать происходящее при обработке изображения.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Кролик и дракон из Стэнфорда

Zzubnik, Wikimedia Commons


С развитием технологий трехмерной печати свои тестовые модели потребовались для 3D-принтеров и сканеров. Самой популярной из них оказалась объемная фигурка кролика, разработанная стэнфордскими учеными Грегом Тарком (Greg Turk) и Марком Левоем (Marc Levoy) в середине 1990-х. Модель была получена сканированием реальной сувенирной фигурки и состоит из 69451 полигонов, удобных для проверки методов сглаживания и сжатия.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Более сложный вариант был создан в том же университете несколько лет спустя: отсканированная фигурка «стэнфордского дракона» превращена в модель, состоящую уже из более чем 871 полигонов. Кроме того, дракон содержит дырку в районе изогнутого хвоста – ее наличие позволяет проверять работу с 3D-моделями, поверхность которых не является топологически связной, что может затруднять применение некоторых технологий.

Калгарийский корпус

Wang Wen-Yan, Entropy, 2010
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ


Набор коротких цифровых файлов разных форматов уже четверть века используется для оценки работы алгоритмов сжатия. Насколько известно, впервые он появился на соревнованиях таких программ, которые известный разработчик Леонид Брукис (Leonid Broukhis) устраивал начиная с 1996 г. Последнее из них состоялось в 2016-м, и победители получили символические денежные призы – по доллару за каждые 111 байт, на которые удалось уменьшить объем «Карларийского корпуса» (Calgary Corpus).

Стандартный набор содержит 14 файлов общим объемом 3141622 байт: тексты в различных кодировках, фрагменты программного кода, исполняемые файлы, изображения и т.п. Сравнивая объемы полученных архивов, можно показать, например, что алгоритмы gzip 1.3.5 сжимают их до 1916624 байт, а 7-zip 9.12b – до 848687 байт. Текущий рекорд был установлен на конкурсе в 2010 г. и составляет 580170 байт.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Тревожный файл EICAR

Ethical Hacking, Malware Analysis, Disinfection Techniques and more
Ethical Hacking, Malware Analysis, Disinfection Techniques and more


Результатом совместной работы экспертов Организации по компьютерным антивирусным исследованиям (CARO) и Европейского института изучения компьютерных антивирусов (EICAR) стала всего одна строка кода EICAR-Test-File. Это небольшой набор ASCII-символов, которые можно ввести прямо с клавиатуры и сохранить в виде исполняемого COM-файла. Вот его текст: «X5O!P%@AP[4\PZX54(P^)7CC)7}$EICAR-STANDARD-ANTIVIRUS-TEST-FILE!$H+H*».

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

EICAR-Test-File предназначен для быстрой проверки работоспособности антивирусной защиты компьютера. Сам по себе он совершенно безвреден, но в норме должен блокироваться резидентным антивирусным мониторингом с выдачей соответствующего сообщения – например, «EICAR Test-NOT virus!!!» у антивируса Avast, – а может вызвать тревогу еще при попытке сохранить файл. Программа работает только в 16- и 32-битных операционных системах на базе DOS Windows NT.

Гарвардские фразочки

Коллекция коротких предложений Harvard sentences используется для проверки качества голосовой связи, включая сотовую и VoIP-телефонию. Они применяются уже более полувека и впервые были составлены гарвардскими лингвистами еще в 1965-м: «The Navy attacked the big task force», «See the cat glaring at the scared mouse» и т.д. Фонетически сбалансированные, эти фразы позволяют оценить работу всех систем, связанных с передачей звука и в современных цифровых форматах.

Для этих целей сотни подходящих предложений были разделены на 72 списка по 10 штук, на выбор пользователя. Сегодня многие из них доступны в виде уже готовы WAV-файлов в открытой библиотеке Open Speech Repository, проговоренных хорошо поставленным английским, мужским и женским голосами.