Сегодня 09 мая 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Google представила свой самый быстрый ИИ-ускоритель — Cloud v5p

Сегодня Google объявила о запуске новой большой языковой модели Gemini. Вместе с ней компания представила свой новый ИИ-ускоритель Cloud TPU v5e (Tensor processing unit — тензорный процессор). Кластер на базе новых TPU состоит из 8960 чипов v5p и оснащён самым быстрым интерконнектом Google — скорость передачи данных может достигать 4800 Гбит/с на чип.

 Источник изображений: Google

Источник изображений: Google

Cloud TPU v5e оснащён 95 Гбайт памяти HBM3 с пропускной способностью 2765 Гбайт/с. Производительность в целочисленных операциях INT8 составляет 918 TOPS (триллионов операций в секунду), тогда как производительность в вычислениях на числах с плавающей запятой BF16 составляет 459 Тфлопс.

 Источник изображения: Google

Google утверждает, что новые чипы значительно быстрее, чем образец предыдущего поколения TPU v4. Новый Cloud TPU v5p предложит двукратное увеличение производительности в операциях с плавающей запятой (FLOPS) и трёхкратное увеличение объёма памяти с высокой пропускной способностью.

По словам Google, новые ускорители TPU v5p способны обучать большие языковые модели, например GPT-3 со 175 млрд параметров, в 2,8 раза быстрее, чем TPU v4, и при этом с меньшими затратами энергии. Более того, благодаря второму поколению SparseCore, TPU v5p может обучать embedding-dense модели в 1,9 раза быстрее, чем TPU v4. Помимо повышения производительности, TPU v5p обеспечивает вдвое более высокий уровень масштабируемости, чем TPU v4, что в сочетании с удвоением производительности обеспечивает в четыре раза больше Флопс на кластер.

Что интересно, по производительности на доллар v5p слегка проигрывает представленным недавно ускорителям TPU v5e. Однако последние можно собирать в кластеры лишь до 256 чипов, а один чип обеспечит лишь 197 Тфлопс в BF16 против 275 Тфлопс у TPU v4 и 459 Тфлопс у TPU v5p.

 Источник изображения: Google

«На ранней стадии использования Google DeepMind и Google Research демонстрировали двукратное ускорение рабочих нагрузок по обучению LLM на основе чипов TPU v5p по сравнению с производительностью, снятой с чипов текущего поколения TPU v4, – пишет Джефф Дин (Jeff Dean), главный научный сотрудник Google DeepMind и Google Research. – Широкая поддержка ML-фреймворков, таких как JAX, PyTorch, TensorFlow, и инструментов оркестровки позволят нам ещё эффективнее масштабироваться, используя чипы v5p. Благодаря второму поколению SparseCore мы также видим значительное улучшение производительности рабочих нагрузок при выполнении встраиваний. TPU жизненно важны для обеспечения наших самых масштабных исследований и инженерных работ на передовых моделях, таких как Gemini».

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Microsoft лишила игроков новой Dishonored и Hi-Fi Rush 2, закрыв Arkane Austin и Tango Gameworks 2 ч.
Google придумала, как легко имитировать на iPhone функцию Circle to Search 7 ч.
США захотели ограничить доступ России и Китая к GPT-4 и другим мощным моделям ИИ 12 ч.
Глава разработки Kingdom Come: Deliverance 2 рассказал, как игра работает на его ПК с Ryzen 9 7950X3D и RTX 4080 Super 12 ч.
Новая Perfect Dark не выйдет из тени в ближайшее время — игра до сих пор «в очень плохом состоянии» 14 ч.
Stack Overflow передаст свой контент для обучения ChatGPT, хотят того пользователи или нет 16 ч.
Безопасный мессенджер Signal заподозрили в работе на правительство США 17 ч.
Готический шутер Trench Tales в эстетике Первой и Второй мировых войн от художника Prey появился на Kickstarter 17 ч.
Скандальная криптобиржа FTX вернёт средства почти всем клиентам — даже с процентами 18 ч.
Путин поручил поставить на контроль образ России в видеоиграх 20 ч.
Зонд «Чанъэ-6» для первого в истории забора грунта с обратной стороны Луны вышел на орбиту спутника 2 ч.
Следствие подозревает Tesla в обмане инвесторов, манипуляциях с ценными бумагами и подлоге данных о FSD 3 ч.
Прогноз Arm разочаровал инвесторов, акции компании подешевели почти на 10 % 4 ч.
SK hynix представила флеш-память Zoned UFS (ZUFS) 4.0, оптимизированную для работы ИИ на мобильных устройствах 6 ч.
Huawei представила беспроводные наушники FreeBuds 6i с автономностью до 35 часов и улучшенной системой шумоподавления 6 ч.
Huawei представила 14-дюймовый ноутбук MateBook 14 2024 с Intel Meteor Lake и сенсорным OLED-экраном 7 ч.
AMD отбирает долю рынка у Intel благодаря спросу на процессоры EPYC и Ryzen 7 ч.
Возобновляемые источники заняли треть в мировой выработке электроэнергии — закат эры ископаемого топлива всё ближе 10 ч.
Космический аппарат TESS возобновил поиск экзопланет после серии сбоев 11 ч.
Новая статья: ИИтоги апреля 2024 г.: парад моделей — и не только 12 ч.