OpenAI представила свой первый специальный процессор вывода Jalapeño, разработанный в сотрудничестве с Broadcom. В процессоре, специально разработанном для систем вывода OpenAI, использовались собственные модели искусственного интеллекта, заявила компания.
Халапеньо в настоящее время проходит испытания, и первые результаты показывают значительно лучшее соотношение производительности на ватт по сравнению с современными альтернативами. О партнерстве с Broadcom было официально объявлено в октябре, при этом продолжаются предположения, что оно направлено на снижение зависимости OpenAI от графических процессоров Nvidia.
Подобно OpenAI, Google и Amazon также создали специальные чипы, называемые «ускорителями искусственного интеллекта», для повышения производительности машинного обучения. Президент OpenAI Грег Брокман обсудил стратегию разработки чипов компании в подкасте вскоре после объявления о партнерстве с Broadcom.
«У нас есть глубокое понимание рабочей нагрузки», — сказал Брокман. «Мы действительно искали конкретные рабочие нагрузки, которые недостаточно обслуживаются, [и спрашивали], как мы можем создать что-то, что сможет ускорить то, что возможно?»
Процессор Jalapeño оптимизирован для вывода, который предполагает выполнение предварительно созданных моделей искусственного интеллекта в ответ на команды пользователя. OpenAI подчеркнул низкие эксплуатационные расходы чипа для моделей кодирования в реальном времени. Более ресурсоемкие задачи, такие как предварительное обучение, скорее всего, по-прежнему будут зависеть от оборудования Nvidia, но снижение затрат на логические выводы может положительно повлиять на финансы OpenAI.
Оптимизация систем вывода может иметь важное значение для экономической жизнеспособности развития ИИ. OpenAI ориентирован на создание различных агентских продуктов, включая Codex, а также необходимых центров обработки данных для развертывания. Переход на нестандартные чипы позволяет компании еще больше улучшить свою инфраструктуру.
«OpenAI не только разрабатывает передовые модели или создает продукты на их основе; он проектирует инфраструктуру под ними: архитектуру чипов, ядра, системы памяти, сети, планирование, системы развертывания и опыт работы с продуктами», — заявили в компании. «Поскольку OpenAI работает через весь стек, каждый уровень может быть оптимизирован для достижения одной и той же цели: сделать модели более быстрыми, надежными и доступными для пользователей».
<час />








