Оказалось ChatGPT смешит людей лучше, чем комики
Писать комедии сложно. Юмор часто субъективен, поэтому то, что кажется смешным вам, может не понравиться другим. Авторы комедий должны постоянно учитывать важнейшие составляющие: время, подачу, оригинальность и избегать клише. Они постоянно балансируют на грани между смешным и глупым.
Но справится ли с этой задачей ИИ, в частности OpenAI ChatGPT 3.5? Может ли он вообще быть смешным? И если сравнить ИИ и людей, кто был бы смешнее? На эти вопросы решили ответить исследователи из Университета Южной Калифорнии (USC).
Кто смешнее?
В некоторых предыдущих исследованиях рассматривался вопрос о том, может ли ChatGPT создавать юмористические тексты. Однако в новой работе ученые старались провести всестороннюю оценку результатов работы ИИ и сравнить ее с человеческими комедиями. Итак, Горенц и Норберт Шварц, профессор психологии и маркетинга, решили сделать именно это, проведя два исследования.
В первом исследовании группе взрослых людей из США было предложено выполнить три разных задания по написанию комедий. В задании с сокращениями им было предложено придумать новую юмористическую фразу для английских сокращений S.T.D., C.L.A.P. и C.O.W..
Также для прохождения теста нужно было заполнить пробелы по трем пунктам. Одним из пунктов было: «Выдающееся достижение, которое вы, вероятно, не указали бы в своем резюме: ________».
Наконец, было задание «прожарка», в котором участники должны были придумать юмористический ответ на вымышленный сценарий. После этого в ChatGPT 3.5 были поставлены те же задачи.
Отдельная группа взрослых оценивала комичность ответов по семибалльной шкале. Ответы ChatGPT были оценены как более смешные, чем ответы людей, и 69,5% участников отдали им предпочтение (26,5% предпочли ответы людей, а 4% сочли оба варианта одинаково смешными).
Во втором исследовании исследователи сравнили способность ChatGPT писать сатирические заголовки новостей. Группа студентов-психологов Американского университета оценила смешность сатирических заголовков по той же семибалльной шкале, что и в первом исследовании.
Студентов также попросили оценить, насколько они любят юмористические материалы, в том числе сатирические новости. Те, кто, по их собственным словам, больше интересовался комедиями и читал сатирические новости, оценили заголовки как более смешные, независимо от того, были ли они созданы искусственным интеллектом или профессиональными сценаристами. Основываясь на средних оценках, 48,8% предпочли заголовки реальных газет, 36,9% предпочли заголовки, сгенерированные ChatGPT, а 14,3% не отдали предпочтения.
Это говорит о том, что среднестатистический участник особо не заметил разницы в качестве заголовков.