NVIDIA Huang Renxun: Vera Rubin siedem chipów w pełnej produkcji, oczekiwane zamówienie na moc obliczeniową o wartości 1 biliona dolarów
Zgodnie z monitoringiem 1M AI News, założyciel i CEO NVIDIA, Jensen Huang, oficjalnie ogłosił podczas konferencji GTC 2026 rozpoczęcie pełnoskalowej produkcji platformy Vera Rubin, integrującej siedem nowych chipów obejmujących pięć typów systemów rackowych, zaprojektowanych jako superkomputer dedykowany dla AI.
Główny rack Vera Rubin NVL72 integruje 72 GPU Rubin oraz 36 CPU Vera połączonych przez NVLink 6. W porównaniu do poprzedniej generacji platformy Blackwell, liczba GPU potrzebnych do trenowania dużych hybrydowych modeli ekspertów została zredukowana do jednej czwartej, a szczytowa wydajność inferencji na wat osiąga do 10 razy więcej niż Blackwell, przy czym koszt na token został zredukowany do jednej dziesiątej.
Pięć typów systemów rackowych stanowi kompletną infrastrukturę fabryki AI:
- Vera Rubin NVL72 GPU Rack
- Vera CPU Rack (256 CPU Vera, 2x bardziej wydajne niż tradycyjne CPU, przyspieszenie o 50%)
- Groq 3 LPX Inference Acceleration Rack
- BlueField-4 STX Storage Rack (zaprojektowany dla AI Agent key-value cache, osiągający do 5x wyższą wydajność inferencji)
- Spectrum-6 SPX Ethernet Rack
W zakresie zarządzania energią, NVIDIA zaprezentowała również platformę DSX: DSX Max-Q pozwala wdrożyć o 30% więcej infrastruktury AI w ramach ustalonego limitu mocy, a DSX Flex może aktywować 100 GW wcześniej niewykorzystanej, nieaktywnej mocy sieciowej.
Dostawcy usług chmurowych tacy jak AWS, Google Cloud, Microsoft Azure, Oracle Cloud, a także producenci systemów jak Cisco, Dell Technologies, Hewlett Packard Enterprise, Lenovo, AMD, wszyscy ogłosili plany wprowadzenia produktów Vera Rubin w drugiej połowie tego roku. Anthropic, Meta, Mistral AI oraz OpenAI wyraźnie zadeklarowali, że wykorzystają tę platformę do trenowania większych modeli.
Jensen Huang stwierdził, że przewiduje, iż łączna wartość zamówień na systemy Blackwell i Vera Rubin w latach 2025-2027 osiągnie co najmniej 1 trillion dolarów, podwajając prognozę 500 billion dolarów przedstawioną podczas zeszłorocznej GTC.
Zastrzeżenie: Treść tego artykułu odzwierciedla wyłącznie opinię autora i nie reprezentuje platformy w żadnym charakterze. Niniejszy artykuł nie ma służyć jako punkt odniesienia przy podejmowaniu decyzji inwestycyjnych.
Może Ci się również spodobać
Popularne
WięcejNVIDIA prezentuje pierwszy chip LPX zasilany przez Groq: zapewnia do 35-krotną poprawę wydajności inferencji na megawat dzięki połączeniu z Vera Rubin oraz prezentuje prototyp nowej generacji Kyber.
W ciągu ostatnich 40 dni pewien klaster portfeli otrzymał około 3 523 000 HYPE od Galaxy Digital, o wartości 144 milionów dolarów.
