Tesla представляет свой новый суперкомпьютер (5-й по мощности в мире) для обучения искусственному интеллекту с автономным управлением

Tesla представила свой новый суперкомпьютер, который уже является пятым по мощности в мире и станет предшественником будущего суперкомпьютера Dojo Dojo.
Он используется для обучения нейронных сетей, питающих автопилот Tesla и грядущий автономный ИИ.
В течение последних нескольких лет Tesla уделяла особое внимание вычислительным мощностям как внутри, так и за пределами своих транспортных средств.
Внутри ему нужны компьютеры, достаточно мощные, чтобы запускать его программное обеспечение для автономного вождения, а снаружи ему нужны суперкомпьютеры для обучения его программного обеспечения для автономного управления, работающего на нейронных сетях, которые получают безумный объем данных, поступающих от автопарка.
Генеральный директор Илон Маск дразнил проект Tesla Dojo, который, по-видимому, состоит из суперкомпьютера, способного выполнять exaFLOP, один квинтиллион (1018) операций с плавающей запятой в секунду, или 1000 петафлопс, что делает его одним из самых мощных компьютеров в мире.
Tesla работает над Dojo последние несколько лет, и Маск намекает, что он должен быть готов к концу этого года.
Но на пути к Додзё компания разработала и другие суперкомпьютеры, и теперь Андрей Карпати, глава отдела искусственного интеллекта Tesla, представил последний из них во время презентации на конференции 2021 года по компьютерному зрению и распознаванию образов.
Во время презентации Карпати приветствовал команду суперкомпьютеров Tesla и продемонстрировал их последнюю работу, третий кластер суперкомпьютеров Tesla:
Tesla заявляет о довольно безумных характеристиках этого нового кластера, которые должны сделать его примерно пятым по мощности компьютером в мире:
720 узлов из 8x A100 80GB. (Всего 5760 графических процессоров)
1,8 EFLOPS (720 узлов * 312 TFLOPS-FP16-A100 * 8 gpu / узлов)
10 ПБ хранилища NVME «горячего уровня» при 1,6 ТБ / с
640 Тбит / с общей коммутационной способности
Карпати так прокомментировал это усилие:
«У нас есть сеть с нейросетевой архитектурой, и у нас есть набор данных, набор данных размером 1,5 петабайта, который требует огромного объема вычислений. Итак, я хотел опробовать этот безумный суперкомпьютер, который мы создаем и используем сейчас. Для нас компьютерное зрение – это хлеб с маслом того, что мы делаем и что позволяет использовать автопилот. И для того, чтобы это работало действительно хорошо, нам нужно осваивать данные флота, обучать массивные нейронные сети и много экспериментировать. Так что мы много вложили в вычисления. В этом случае у нас есть кластер, который мы построили с 720 узлами 8x A100 версии 80GB. Итак, это огромный суперкомпьютер. Я вообще-то думаю, что по количеству провалов это примерно 5-й суперкомпьютер в мире ».
Инженер Tesla не хотел вдаваться в подробности проекта Dojo, но сказал, что это будет еще лучший суперкомпьютер, оптимизированный для обучения нейронной сети, чем нынешний кластер Tesla.
Маск также ранее заявлял, что Tesla планирует в конечном итоге сделать свои суперкомпьютеры доступными для других компаний, чтобы они могли обучать на нем свои нейронные сети.