Недавнее исследование, опубликованное в Границы в общении пролил критический свет на воздействие искусственного интеллекта на окружающую среду, показывая, что не все подсказки искусственного интеллекта создаются равными, когда речь идет о выбросах углерода. Исследование подчеркивает, что более сложные «модели рассуждений» в моделях крупных языков (LLMS) могут генерировать значительно больше CO₂, чем их «краткие» аналоги, что вызвало опасения среди исследователей и климатических сторонников относительно эскалационных потребностей ИИ в области энергии.

Исследование, которое тщательно оценило 14 различных LLM с использованием стандартизированного набора из 500 вопросов в разных предметных областях, обнаружило прямую корреляцию между количеством «токенов мышления», генерируемых моделью на запрос и связанными с ним выбросами Co₂. Максимилиан Dauner, аспирант в Университете прикладных наук Hochschule München и ведущий автор статьи, подчеркнул, что «воздействие на окружающую среду подготовленных LLMS решительно определяется их подходом рассуждений с явными процессами рассуждений, значительно повышает потребление энергии и выбросы углерода».

В частности, результаты показывают, что модели рассуждений, которые обладают более крупными учебными наборами и требуют большего времени обработки, дают значительно более высокие результаты CO₂. В некоторых случаях эти сложные модели генерировали в 50 раз превышают выбросы кратких моделей. Это неравенство еще больше усугубляется сложностью поставленных вопросов; Открытые или сложные запросы, такие как те, которые включают в себя продвинутую алгебру или философские концепции, привели к большему углеродному следу по сравнению с более простыми подсказками, такими как вопросы истории средней школы.

Модели рассуждений, иногда называемые «моделями мышления», оптимизированы для решения сложных задач, которые требуют логики, пошаговых сбоев или подробных инструкций. В этих моделях, примером которых такие версии, как GPT-4O Openai и O1/O3-Mini, используют обработку исследователей LLM «Цепочка мыслей». Это позволяет им реагировать более намеренно и генерировать больше человеческих ответов, хотя и с компромиссом увеличения времени обработки и, следовательно, более высокого потребления энергии. И наоборот, обобщенные модели определяют приоритеты скорости и ясности для более простых задач.

  Что означает «Ну-Ну-Ну» в TikTok?

Исследователи провели свое тестирование в двух этапах: изначально с вопросами с множественным выбором, за которыми следуют подсказки свободного ответа. В среднем, модели рассуждений создали удивительные 543,5 токенов за вопрос, резко контрастирующий с лишь 37,7 токенами, произведенными краткими моделями. Например, «Cogito», идентифицированная как наиболее точная исследованная модель рассуждения, созданная в три раза больше Co₂, чем модели аналогичного размера, оптимизированные для кратких ответов. В статье явно говорится, что «с экологической точки зрения модели рассуждений последовательно демонстрировали более высокие выбросы, которые обусловлены главным образом их повышенным производством токенов».

Хотя разница в выбросах на индивидуальную подсказку может показаться незначительной, совокупный эффект в масштабе является значительным. Исследование проекта, которые задают вопросы DeepSeek Model 600 000 модели 600 000 человек, приведут к примерно такому же количеству CO₂, что и перелет в обратном направлении из Лондона в Нью-Йорк. Для сравнения, модель QWEN 2,5, не связанная с Reeshing, могла ответить в три раза больше вопросов, прежде чем достичь эквивалентного уровня выбросов. Это подчеркивает критический компромисс между точностью LLM и экологической устойчивостью, поскольку «по мере увеличения размера модели точность имеет тенденцию улучшаться», но «эта прибыль также связана с существенным ростом как при выбросах Co₂, так и количества генерируемых токенов».

  Epic заплатит Apple 6 миллионов

Эти выводы появляются на фоне жесткой глобальной конкуренции между технологическими гигантами за разработку все более продвинутых моделей ИИ. Эскалационный спрос на инфраструктуру, управляемую ИИ, готов создать значительную нагрузку на существующие энергетические сетки. За прошедший год Apple объявила о планах инвестировать ошеломляющие 500 миллиардов долларов в производственные и обработанные центры обработки данных в течение следующих четырех лет. Аналогичным образом, Project Stargate, совместная инициатива с участием OpenAI, SoftBank и Oracle, пообещала эквивалентные 500 миллиардов долларов на ориентированные на AI Центры обработки данных. Недавний отчет в обзоре технологий MIT показывает, что с 2017 года центры обработки данных все чаще включают энергоемкое оборудование, специально предназначенное для сложных вычислений искусственного интеллекта, что приводит к росту потребления энергии.

По оценкам Института исследований электроэнергии (EPRI), что центры обработки обработки данных, поддерживающих передовые модели ИИ, могут составить до 9,1 процента от общего спроса в энергии США к концу десятилетия, что значительно увеличилось по сравнению с приблизительно 4,4 процента. Чтобы удовлетворить этот растущий спрос на энергию, крупные технологические компании изучают различные стратегии производства электроэнергии. Meta, Google и Microsoft имеют все кофейные партнерские отношения с атомными электростанциями. Примечательно, что Microsoft подписала 20-летнее соглашение о поиске энергии из ядерного завода из трех миль острова в Пенсильвании для владения растущим парком обработки данных. Meta также делает существенные инвестиции в геотермальные технологии, в то время как генеральный директор Openai Сэм Альтман, как сообщается, инвестирует в экспериментальное ядерное слияние, признавая, что будущий возраст ИИ потребует «энергетического прорыва». Несмотря на эти усилия, недавние исследования показывают, что почти наверняка, что будет необходимо больше ископаемого топлива, особенно природного газа, потребуется полностью соответствовать массовым энергетическим требованиям ИИ.

  Лучшие проекты в умной сети Binance: Radio Caca, EverGrow Coin и CryptoMines

Тем не менее, исследователи считают, что их выводы могут дать возможность повседневным пользователям ИИ смягчать их углеродное воздействие. Понимая значительно более высокую энергоэнергетическую интенсивность моделей рассуждений, пользователи могли бы использовать их более экономно, полагаясь на краткие модели для общих ежедневных задач, таких как веб -поиск и основной ответ на вопрос. Dauner подчеркнул этот момент, заявив: «Если пользователи знают точную стоимость их, сгенерированных AI, такие как случайно превращение себя в фигуру, они могут быть более избирательными и вдумчивыми о том, когда и как они используют эти технологии». Это упреждающее поведение пользователя в сочетании с постоянными достижениями в энергоэффективном дизайне ИИ будет иметь решающее значение для навигации по экологическим проблемам, возникающим в результате быстрого расширения искусственного интеллекта.

Source: Углеродный след рассуждений AI сильно варьируется