Сотням тысяч работников краудсорсинговых платформ грозит увольнение. Их вытесняет ИИ
В 2005 году Amazon запустил сервис, который получил название Amazon Mechanical Turk. Это краудсорсинговая платформа, объединяющая удаленных работников, которые выполняют элементарные действия. Это обычно идентификация объектов на видео и изображениях, описания продуктов, ответы на вопросы анкет. Например, такая типичная задача: выберите из этих фотографий ту, которая лучше всего представляет продукт. Amazon справедливо полагает, что выбрать «лучшую» с точки зрения человека фотографию, лучше всего может именно человек. Эти действия складываются в большие проекты. Джефф Безос еще в 2001 году назвал это сочетание человеческих и цифровых возможностей «искусственным интеллектом».
Сегодня около четверти миллиона человек работают «механическими турками» компании Amazon. И это только одна из подобных платформ.
Исследователи из швейцарского университета EPFL пришли к выводу, что сегодня «турки», которые обеспечивали важный человеческий вклад в работу многих систем, полагаются на генерируемый ИИ контент для выполнения своих задач. Ученые назвали это явление «искусственным искусственным интеллектом».
Этот термин может вызвать улыбку, но исследователи говорят, что полученные результаты вызывают серьезные опасения. По словам ведущего автора работы Вениамина Веселовского, использование «турками» генераторов ИИ, подобных ChatGPT, для выполнения своих задач: «значительно снижает полезность данных, полученных с помощью краудсорсинга» и ставит под сомнение само существование таких платформ.
Хотя Большие языковые модели (LLM) вполне справляются с обработкой обучающих данных, для некоторых задач человеческий вклад очень важен. Люди маркируют данные, введенные в модели, описывают изображения и отвечают на запросы CAPTCHA быстрее и точнее, чем компьютеры. Полный отказ от участия человека в таких процессах может снизить качества работы.
«Заманчиво полагаться на краудсорсинг для проверки результатов работы LLM или для создания золотого стандарта данных, производимых человеком, для сравнения c данными, произведенными чат-ботами», — говорит Веселовский. — «Но если сами краудсорсеры используют LLM для того, чтобы повысить свою производительность и, соответственно, свой доход на краудсорсинговых платформах, такой стандарт "загрязняется" и теряет всякий смысл».
Трудная жизнь современного «турка»
Термин «турок» происходит от шахматного «автоматона» австрийского мастера фон Кемпелена. Этот «механический турок» в XVIII и XIX веках победил многих сильных шахматистов. Среди побежденных были шахматный мастер Филидор, император Наполеон и американский ученый и политик Бенджамин Франклин. Люди думали, что они играют с автоматоном, и не знали, что внутри «машины» скрывается человек. Обычно фон Кемпелен приглашал на эту роль сильных шахматистов небольшого роста.
Краудсорсинг с современными турками стал миллиардной индустрией. Правда, сегодня турки получают довольно низкую зарплату от 2 до 5 долларов в час. Но, благодаря интернету, работу могут выполнять люди из небогатых стран, где заработок 100-200 долларов неделю может быть довольно значительным.
И всей этой отрасли теперь угрожает резкое внедрение Больших языковых моделей. Согласно исследованию, модель ChatGPT 3.5, выполняющая задания по классификации, работает значительно лучше, чем работники краудсорсинга, при затратах примерно в два раза меньше. ChatGPT 4.0 только усилил эти различия.
Современные «турки» столкнулись с растущим давлением — буквально с конкуренцией ИИ. От них требуется производить больше контента и делать это быстрее. Это, в свою очередь, ведет к тому, что они все чаще полагаются на ресурсы ИИ.
На основе анализа Больших языковых моделей работниками Amazon Mechanical Turk исследователи EPFL подсчитали, что от 33% до 46% заданий работники уже сегодня выполняют с помощью чат-ботов.
«Большие языковые модели становятся все более популярными, а мультимодальные модели, поддерживающие не только текст, но и ввод и вывод изображений и видео, находятся на подъеме», — говорит Веселовский. — «Таким образом, наши результаты следует рассматривать как "канарейку в угольной шахте", которая должна напомнить платформам, исследователям и работникам крауд-центров о необходимости поиска новых способов обеспечения того, чтобы человеческие данные оставались человеческими».
Рынок краудсорсинговых платформ может стать первым, который будет закрыт под давлением ИИ. А это сотни тысяч рабочих мест, в основным, в небогатых странах.