В ходе эксперимента, проведенного австралийским правительством, искусственный интеллект (ИИ) сравнивался с человеческим интеллектом при резюмировании сложных документов, и люди оказались более эффективными во всех аспектах.

Проведенный австралийским корпоративным регулирующим органом, Комиссия по ценным бумагам и инвестициям (ASIC), исследование было направлено на оценку эффективности искусственного интеллекта в задачах, которые обычно требуют тщательного анализа и сосредоточенности. На основании результатов можно сделать вывод, что ИИ может создавать больше работы, а не сокращать ее.

Человеческое прикосновение превзошло ИИ в правительственном испытании
Участники-люди решительно превзошли ИИ, набрав впечатляющие 81% по оценочной шкале, по сравнению с 47% у ИИ (Изображение предоставлено)

ИИ не дотягивает до рецензентов-людей

Ранее в этом году Amazon протестировала различные модели ИИ от разных производителей, помогая правительству Австралии этот эксперимент. В конечном итоге для этой задачи был выбран Llama2-70B от Meta. ИИ было поручено обобщить пять представлений парламентского расследования, сосредоточившись на упоминаниях ASIC, рекомендациях, ссылках на регулирование и других ключевых деталях. Одновременно десять человек разного уровня — сотрудники ASIC — получили ту же задачу. Эта группа рецензентов, не знавшая об участии ИИ, оценила резюме на предмет согласованности, длины, релевантности и точности ссылок на регулирование.

Участники-люди решительно превзошли ИИ, показав впечатляющий результат 81% по оценочной рубрике, по сравнению с 47% для ИИ. Люди преуспели в определении ссылок на документы ASIC, что, как известно, является сложной задачей для ИИ. Более того, человеческие резюме хвалили за сохранение акцента, нюансов и контекста, в то время как ИИ часто пропускал эти критические элементы. Рецензенты также отметили, что резюме ИИ иногда содержали нерелевантную информацию или пропускали важные детали, что делало их менее надежными.

  Как скрыть свои достижения «Наследие Хогвартса»?
Человеческое прикосновение превзошло ИИ в правительственном испытании
С другой стороны, привычка ИИ игнорировать ключевые детали и совершать ошибки может привести к появлению дополнительных задач для людей (Изображение предоставлено)

Последствия эффективности ИИ в обобщении

Результаты эксперимента показывают, что современная технология ИИ может быть не столь эффективна, как принято считать, с точки зрения экономии времени. С другой стороны, привычка ИИ упускать из виду ключевые детали и совершать ошибки может привести к дополнительным задачам для людей, которым придется проверять и редактировать созданный ИИ материал. Рецензенты были обеспокоены тем, что зависимость от ИИ для реферирования может быть невыгодной, поскольку он часто не передает основные моменты документов так же хорошо, как рецензенты-люди.

Хотя в отчете были признаны определенные ограничения, такие как устаревшая модель ИИ, в конечном итоге был сделан вывод о том, что человеческие навыки в интерпретации и оценке информации по-прежнему превосходят ИИ. Испытание подчеркнуло важность рассмотрения ИИ как инструмента, помогающего, а не заменяющего человеческий труд в задачах, требующих глубокого понимания контекста и тонкости.

  Как сделать снимок экрана в WearOS?
Человеческое прикосновение превзошло ИИ в правительственном испытании
Испытание также поднимает более общие вопросы о том, насколько прозрачен ИИ при использовании в государственных процедурах (Изображение предоставлено)

Прозрачность правительства и ИИ

Результаты отчета не стали неожиданностью для Сенатор от партии зеленых Дэвид Шоебриджкоторый возглавлял расследование, приведшее к публикации. Он упомянул, что хотя ИИ может помочь в оценке заявок, он всегда должен контролироваться людьми. Эксперимент подчеркивает идею о том, что в настоящее время ИИ наиболее полезен, когда помогает человеческим способностям, а не берет их под свой контроль.

Испытание также поднимает более общие вопросы о том, насколько прозрачен ИИ при использовании в государственных процедурах. Сенатор Шобридж подчеркнул важность того, чтобы правительственные департаменты проявляли инициативу по раскрытию использования ИИ, а не ждали, пока информация будет раскрыта во время слушаний в сенатском комитете.


Автор изображения: Фуркан Демиркая / В середине пути

Source: Человеческое прикосновение превзошло ИИ в правительственном испытании