Google представила подробную информацию о своем подразделении обработки Tensor Ironwood (TPU) в Hot Chips 2025, после его первоначального объявления в Google Cloud в следующем ’25 в апреле. Ironwood представляет TPU седьмого поколения Google, специально предназначенное для крупномасштабных рабочих нагрузок с выводом, что отмечает переход от предыдущих поколений, ориентированных на обучение. Каждый чип Ironwood включает в себя два вычислительных штаба, обеспечивая 4614 TFLOPS производительности FP8. Он имеет восемь стеков HBM3E, обеспечивающие 192 ГБ памяти на чип с пропускной способностью 7,3 ТБ/с. Архитектура системы масштабируется до 9 216 чипов на капсулу, облегченную 1,2 ТБ/с полосы пропускания ввода/вывода, что устраняет необходимость в логике клея и достигая в общей сложности 42,5 экзафлопа производительности. Ключевым моментом Ironwood является его способность памяти. Один стручок предоставляет 1,77 PB непосредственно адресуемого HBM, который, как утверждает Google, является новым мировым рекордом для суперкомпьютеров общей памяти. Эта обширная емкость памяти стала возможной благодаря оптическим переключателям, которые связывают стойки вместе. TPU Ironwood также подчеркивает надежность и устойчивость. Аппаратное обеспечение может автоматически реконфигурировать вокруг неудачных узлов и восстанавливать рабочие нагрузки с контрольных точек. Особенности включают в себя корень доверия, встроенные функции самопроверка, смягчение немого данных о коррупции и функции логического ремонта для повышения урожайности производства. Согласно Google, акцент на RAS (надежность, доступность и обслуживание) видны на протяжении всей архитектуры. Охлаждение обрабатывается раствором холодной пластины, интегрированным с инфраструктурой жидкого охлаждения Google третьего поколения. Google утверждает, что Ironwood достигает двойного улучшения производительности на ватт по сравнению с его предшественником Trillium. Динамическое напряжение и масштабирование частоты еще больше повышают эффективность во время различных рабочих нагрузок. Методы ИИ также использовались в разработке Железного дерева для оптимизации цепей ALU и планов этажей. Sparsecore четвертого поколения был добавлен для ускорения встраиваний и коллективных операций, поддерживая рабочие нагрузки, такие как рекомендательные двигатели. Развертывание Ironwood в настоящее время ведется в гиперскла в области облачных центров Google. Тем не менее, TPU остается внутренней платформой и не доступен напрямую для клиентов Google Cloud. Райан Смит из ServetheHome прокомментировал презентацию Google на Hot Chips 2025, заявив: «Это была потрясающая презентация. Google увидел необходимость создания высокопроизводительного искусственного искусства, вычислив много поколений назад. Теперь компания инновации на всех уровнях от чипсов, до межконтактов, и для физической инфраструктуры. Даже в том, что последний Hot Hot Chips.

  Sony представляет новые Android-плееры Walkman, вызывающие ностальгию

Source: Google подробностей Ironwood TPU для крупномасштабного вывода