Новият и изключително скъп проект на Илон Мъск, суперкомпютърът xAI Colossus за системи с изкуствен интелект, отвори врати за обществеността за първи път. Журналисти от ресурса ServeTheHome бяха допуснати в съоръжението. Те говориха подробно за клъстера на сървърите на Supermicro, чието сглобяване отне 122 дни и той вече работи почти два месеца.
Сървърите с GPU са изградени на платформата Nvidia HGX H100. Всеки от тях включва осем ускорителя Nvidia H100 и универсална система за течно охлаждане Supermicro 4U с горещи компоненти за всеки GPU поотделно. Сървърите са инсталирани в шкафове по осем, което води до 64 ускорителя на шкаф. В долната част на всяка стойка има друго устройство Supermicro 4U с резервна помпена система и система за наблюдение на стойката.
Стелажите са групирани в групи по осем, давайки 512 GPU на масив. Всеки сървър има четири резервни захранвания; в задната част на стелажите можете да видите трифазни захранвания и Ethernet комутатори; има и колектори с размер на стелажа, които се справят с течното охлаждане. Клъстерът Colossus съдържа повече от 1500 стелажа или около 200 масива. Ускорителите на тези масиви са инсталирани само за три седмици, каза по-рано главният изпълнителен директор на Nvidia Дженсен Хуанг.
Поради високите изисквания за производителност на AI суперклъстера, който непрекъснато обучава модели, инженерите на xAI трябваше да положат усилия по отношение на работата в мрежа. Всяка графична карта е оборудвана със специален 400 GbE мрежов контролер с допълнителен 400 GbE мрежов адаптер на сървър. Тоест всеки сървър на Nvidia HGX H100 има 3.6 Tbps Ethernet - да, целият клъстер работи на Ethernet, а не на InfiniBand или други екзотични интерфейси, стандартни за суперкомпютрите.
Суперкомпютърът изисква не само графични процесори, но и памет и централни процесори за обучение на AI модели, включително Grok 3, но xAI само частично разкри информация за тях. Цензурираните видеоклипове показват, че сървърите, работещи на x86 чипове в кутии Supermicro, са отговорни за това - те също са оборудвани с течно охлаждане и са проектирани да работят или като хранилище на данни, или за работни натоварвания, насочени към централните процесори.
На обекта са монтирани и батерии Tesla Megapack. Когато клъстерът работи, са възможни внезапни промени в потреблението на енергия, така че тези батерии, с капацитет до 3.9 MWh всяка, се налага да бъдат инсталирани между електрическата мрежа и суперкомпютъра като енергиен буфер. Вижте повече във видеото.
Напиши коментар:
КОМЕНТАРИ КЪМ СТАТИЯТА
1 Този коментар е премахнат от модератор.
2 Един
Коментиран от #3, #8, #10
16:20 29.10.2024
3 Айде бе
До коментар #2 от "Един":
На 1 септември 2023 г.ректорът на Московския държавен университет „Ломоносов“ (МГУ) Виктор Садовничи обяви пускането в експлоатация на суперкомпютъра „МГУ-270“ с ИИ-производителност от 400 Pflops (точността на изчисленията не е посочена). Според пресслужбата на МГУ вече е обявено, че новата машина е започнала да изпълнява тестови задачи. Комплексът ще стане част от обединената мрежа от научни суперкомпютърни центрове на Русия и ще позволи да се създават руски езикови модели, подобни на GPT (който е в основата на ChatGPT).Съобщава се, че суперкомпютърът се разработва от 2020 година с участието на преподаватели от МГУ. Системата включва около 100 най-съвременни ускорителя, уточнява ТАСС. Машината използва неназована 200-гигахерцова междусистемна връзка, която обхваща и съхранението на данни. За управление и интеграция с външна инфраструктура се използва мрежа със скорост 100 Gbps. Освен това машината е получила нови инженерни системи, а при създаването на целия комплекс широко са използвани възли и компоненти руско производство. „МГУ-270“ ще образува единен изчислителен клъстер с пуснатия по-рано в експлоатация суперкомпютър „Ломоносов-2“.
Японецът” Fugaku продължава да държи водещата позиция, която за първи път спечели през юни 2020 г. Неговият резултат е 442 петафлопа. Инсталиран в Центъра за изчислителни науки Riken в Кобе, Япония, той е разработен съвместно от Riken и Fujitsu и е базиран на персонализирания процесор ARM A64FX на Fujitsu.
Коментиран от #4, #5, #6, #9
16:41 29.10.2024
4 Този коментар е премахнат от модератор.
5 Хайде де
До коментар #3 от "Айде бе":
"Съобщава се, че суперкомпютърът се разработва от 2020 година с участието на преподаватели от МГУ. Системата включва около 100 най-съвременни ускорителя,"А осъзнаваш ли, че тук не става въпрос за 100, а за 100 000 ускорителя, които не са съвременни през 2020, а са съвременни днес?
16:57 29.10.2024
6 Тоя
До коментар #3 от "Айде бе":
компютър лампов ли е?Коментиран от #7
16:58 29.10.2024
7 Един
До коментар #6 от "Тоя":
Мисля, че казаха че бил с кюмюр, ама планират през 2030 да се преустрои плавно на дърва.17:07 29.10.2024
8 Комуняст
До коментар #2 от "Един":
Не говори така против руснаците, те са те освободили от турско робство.17:48 29.10.2024
9 Този коментар е премахнат от модератор.
10 Има и други
До коментар #2 от "Един":
Освен в сащ има и китайски:В Китай е създаден най-малкият квантов компютър в света
Специалисти от Националния университет Цинхуа представиха квантов компютър, който се позиционира като най-малкия в индустрията. Работата на устройство ...
16:19 30.10.2024