NVIDIA GTC 2026 u. a. (0530-0601)

NVIDIA GTC 2026 ① Vera Rubin geht in Vollproduktion

• Kernaussagen

„Vera Rubin bietet die Grundlage für KI-Fabriken der nächsten Generation im POD-Maßstab und liefert einen 10-fach höheren Agentendurchsatz im Vergleich zur Vorgängergeneration, der NVIDIA Grace Blackwell-Plattform.“

„Einschließlich 150 Unternehmen in Taiwan produzieren Hunderte von NVIDIA-Ökosystempartnern Vera Rubin in mehr als 350 Fabriken in 30 Ländern weltweit.“

„Agentische KI ist eine neue Art von Workload. Ein einzelner Prompt kann eine 1.000-Schritte-Reise beginnen, die Reasoning, Suche, Werkzeugnutzung und Antwortgenerierung umfasst.“

„Vera Rubin soll ab diesem Herbst ausgeliefert werden.“

• Erwartete Auswirkungen

Die Ankündigung, die auf dem GTC 2026 die größte Marktaufmerksamkeit auf sich zog, war die Bestätigung des Eintritts von Vera Rubin in die Vollproduktion. Unter Investoren waren Bedenken hinsichtlich möglicher Verzögerungen bei Vera Rubin-Lieferungen kontinuierlich geäußert worden, und diese Ankündigung hat dieses Risiko offiziell beseitigt.

Vera Rubin ist das dritte NVIDIA MGX-Rack-Scale-System, strukturiert mit fünf zweckdedizierten Racks, die als ein einziger riesiger KI-Supercomputer arbeiten. Es integriert das Vera Rubin NVL72 GPU-System, Vera CPU, BlueField-4 STX-Speicher und Spectrum-6-Netzwerk in einem einzigen End-to-End-System und liefert einen 10-fach verbesserten Agentendurchsatz gegenüber der Vorgängergeneration Grace Blackwell.

Auch der Umfang der Lieferkette wurde bestätigt. Die Produktion läuft in mehr als 350 Fabriken in 30 Ländern, darunter 150 Unternehmen in Taiwan, mit Beteiligung aller großen Serverhersteller, darunter Dell, HPE, Lenovo, Supermicro, Foxconn, Quanta und Wiwynn. Die Auslieferungen sind ab diesem Herbst geplant.

Die Kernlogik, die Jensen Huang betonte, war der strukturelle Wandel der Workloads im Zeitalter der agentischen KI. Während konventionelle KI auf einfachen Anfrage-Antwort-Strukturen basierte, führt agentische KI eine Kette von 1.000 aufeinanderfolgenden Schritten aus einem einzigen Prompt aus, die Reasoning, Suche, Werkzeugnutzung und Antwortgenerierung umfasst. Dies erfordert eine weitaus höhere Computerdichte und kontinuierlichen Betrieb im Vergleich zur bestehenden Infrastruktur, was darauf hindeutet, dass die Nachfragebasis für Vera Rubin strukturell wächst. Die Einführung von Spectrum-X Ethernet Photonics (CPO-basiert) liefert zudem eine 5-fach bessere Energieeffizienz, 5-fach längere KI-Betriebszeit und 1,3-fach schnellere Bereitstellung im Vergleich zu herkömmlichen Transceiver-basierten Netzwerken.

2. NVIDIA GTC 2026 ② Vera CPU — Eine direkte Herausforderung an Intel und AMD

• Kernaussagen

„Vera liefert 1,8-fach höhere Leistung gegenüber x86 bei gängigen agentischen Werkzeugen wie Python, Codeanalyse und Kompilierung und ermöglicht es Rechenzentren, mehr Token-Umsatz zu generieren.“

„Bei SQL-Workloads liefert es die 3-fache Leistung der x86-Wettbewerber AMD/Intel und bei der Datenverarbeitung die 6-fache Leistung.“

„Im Zeitalter der KI-Agenten ist die CPU nun zum Engpass für die GPU geworden.“

„Das CPU-Angebot wird erheblich sein. Dies wird unser neuer wichtiger Wachstumstreiber sein.“

• Erwartete Auswirkungen

Der eigentliche Protagonist dieses GTC war die Vera CPU. Die Samsung Securities-Analyse bewertete ebenfalls, dass „diese Keynote im Zeitalter der agentischen KI auf die Vera CPU ausgerichtet war.“ Die wettbewerbliche Bedeutung ist klar: NVIDIA tritt direkt in den Rechenzentrum-CPU-Markt mit einem eigenständigen Produkt ein und markiert damit eine vollständige Eskalation des Wettbewerbs mit Intel und AMD.

Die Vera CPU-Spezifikationen sind konkret. Basierend auf dem NVIDIA Custom Olympus-Kern verfügt sie über 88 Kerne und 176 Threads, mit 1,2 TB/s LPDDR5X ECC-Speicherbandbreite, 40% niedrigerer Ladelatenz gegenüber x86 und 3,4 TB/s Kern-zu-Kern-Bandbreite. Die TDP reicht von 250 W bis 450 W. Bei der Leistung beansprucht sie einen 1,8-fachen Vorteil gegenüber x86 bei allgemeinen agentischen Workloads, 3-fach bei SQL-Workloads und 6-fach bei der Datenverarbeitung.

Die wettbewerblichen Implikationen sind erheblich. Historisch gesehen verkaufte NVIDIA eine CPU für je zwei GPUs, aber in agentischen KI-Umgebungen nähert sich das CPU-zu-GPU-Verhältnis nun fast 1:1. Eigenständige CPU-Racks werden ebenfalls konfiguriert, mit 256 CPUs pro System. Dies stellt eine direkte Herausforderung von NVIDIA an die Dominanz von Intel Xeon, AMD EPYC und Amazon Graviton im Rechenzentrum-CPU-Markt dar — eine strukturelle Bedrohung für Intel und AMD, CPU-Marktanteile an das Unternehmen zu verlieren, dessen GPU-Kunden sie beliefern. Als erste bestätigte Kunden wurden Anthropic, OpenAI und SpaceX genannt, wobei die Serienproduktion für Q3 geplant ist. Da JP Morgan prognostiziert, dass sich das GPU-zu-CPU-Verhältnis von 5,4:1 im Jahr 2023 auf 2,4:1 im Jahr 2028 verschieben wird, ist NVIDIAs Vera CPU als direkter Nutznießer dieser CPU-Nachfrageexpansionsphase positioniert.

3. NVIDIA GTC 2026 ③ RTX Spark — NVIDIA tritt in den KI-PC-Markt ein

• Kernaussagen

„Die dreijährige Partnerschaft zwischen Microsoft und NVIDIA konzentriert sich auf die ‚Neuerfindung des PCs‘.“

„Die Flaggschiff-Version verfügt über 20 CPU-Kerne, 6.144 GPU-Kerne und 128 GB LPDDR5X-Speicher.“

„Mit 128 GB Unified Memory können KI-Agenten mit bis zu 120 Milliarden Parametern lokal ausgeführt werden.“

„Derzeit sind 8 Laptop-Modelle bestätigt, mit mehr als 30 Laptops und über 10 Desktop-Modellen in der Entwicklung.“

• Erwartete Auswirkungen

NVIDIA ist erstmals in den Consumer-PC-Chip-Markt eingetreten. RTX Spark ist ein SoC, das einen Blackwell RTX GPU mit einem 20-Kern Grace CPU, gemeinsam mit MediaTek entwickelt, über NVLink C2C kombiniert und 1 Petaflop KI-Rechenleistung sowie bis zu 128 GB Unified Memory (600 GB/s) liefert. SK Hynix’s LPDDR5X wurde als primärer Speicherlieferant bestätigt.

Das wichtigste Differenzierungsmerkmal ist die lokale KI-Agenten-Ausführung. Mit 128 GB Unified Memory kann das Gerät LLMs mit bis zu 120 Milliarden Parametern lokal ohne Cloud-Abhängigkeit ausführen und unterstützt auch 1 Million Token-Kontext. Während bisherige KI-PCs auf Cloud-API-Aufrufe angewiesen waren, führt RTX Spark große Modelle direkt auf dem Gerät aus — ein grundlegend anderes Paradigma.

Der Ökosystemumfang wurde ebenfalls bestätigt. Microsoft Surface Laptop Ultra führt die Produktlinie an, mit ASUS, Dell, HP, Lenovo, MSI, Acer und Gigabyte, die alle Herbststarts ankündigen. Derzeit sind mehr als 30 Laptops und über 10 Desktop-Modelle in der Entwicklung. Die Wettbewerbslandschaft erstreckt sich auf Qualcomm Snapdragon X Elite, Intel, AMD und Apples M-Serie. Später in diesem Jahr wird auch die DGX Station for Windows mit dem GB300 Grace Blackwell Ultra auf den Markt kommen, die NVIDIAs PC-Ökosystem von Consumer-Geräten bis hin zu Enterprise-Workstations schrittweise erweitert.

4. Meta startet KI-Abonnementdienst — BofA: „1% Konversionsrate könnte jährlich 4,2 Mrd. USD zusätzlichen Umsatz generieren“

• Kernaussagen

„Laut Bloomberg hat Meta einen kostenpflichtigen Verbraucher-Abonnementdienst für seine Meta AI-Funktionen eingeführt und dabei zwei Tarifstufen eingeführt. Der Basistarif Meta One Plus kostet 7,99 USD pro Monat und richtet sich an Nutzer, die Bilder und Videos generieren oder erweiterte Reasoning-Funktionen nutzen. Meta One Premium kostet 19,99 USD pro Monat und bietet höhere Nutzungslimits.“

„Snaps stärker als erwartete Abonnement-Penetrationsrate von etwa 5,5% der täglich aktiven Nutzer deutet darauf hin, dass Meta eine bedeutende Abonnementmöglichkeit für seine verschiedenen Produkte haben könnte. Ausgehend von einer KI-Abonnement-Konversionsrate von 1% — etwa 35 Millionen Nutzer — und einem monatlichen ARPU von etwa 10 USD könnte ein jährlicher Zusatzumsatz von etwa 4,2 Mrd. USD generiert werden. Dies entspricht einem Aufwärtspotenzial von etwa 1,5% gegenüber den Konsensschätzungen für den Umsatz 2027.“

„Der Markt für KI-Unternehmenslösungen, einschließlich Cloud-Kapazität, soll bis 2028 1 Billion USD übersteigen, und selbst ein kleiner Marktanteil für Meta könnte einen bedeutenden Beitrag leisten.“

• Erwartete Auswirkungen

Meta hat offiziell KI-Abonnementdienste für WhatsApp, Instagram und Facebook eingeführt. Der Basistarif Meta One Plus kostet 7,99 USD pro Monat und bietet Bild- und Videogenerierung sowie erweiterte Reasoning-Funktionen, während Meta One Premium 19,99 USD pro Monat mit höheren Nutzungslimits kostet. Der Start begann in Singapur, Guatemala und Bolivien, mit einer breiteren regionalen Expansion innerhalb weniger Wochen. Meta betreibt bereits Abonnementdienste zu 2,99–3,99 USD pro Monat auf WhatsApp, Instagram und Facebook, und diese KI-Abonnementschicht liegt darüber.

BofA quantifizierte das Monetarisierungspotenzial mit spezifischen Zahlen. Unter Verwendung von Snaps Abonnement-Penetrationsrate von etwa 5,5% der täglich aktiven Nutzer als Referenz und Annahme einer konservativen 1% KI-Abonnement-Konversionsrate von etwa 35 Millionen Nutzern mit einem monatlichen ARPU von etwa 10 USD ergibt sich ein jährlicher Zusatzumsatz von etwa 4,2 Mrd. USD — was einem Aufwärtspotenzial von etwa 1,5% gegenüber den Konsensschätzungen für den Umsatz 2027 entspricht.

Die übergeordnete Bedeutung dieses Starts liegt darin, dass Meta offiziell eine Struktur formalisiert hat, KI-Investitionskosten direkt in Umsatz umzuwandeln. Nach Metas Ankündigung deutlich höherer Betriebskosten und Investitionsausgaben für 2026 war die Aktie um 16% gefallen, während der NASDAQ im gleichen Zeitraum um 7% gestiegen war — ein direkter Ausdruck der mangelnden Marktsichtbarkeit in ein Umsatzmodell, das die KI-Investitionen rechtfertigen kann. Dieser Abonnementstart ist die erste konkrete Antwort auf diese Frage. Unterdessen wies Metas CEO auf der jährlichen Hauptversammlung darauf hin, dass der Eintritt in den Cloud-Computing-Markt eine Option bleibt, sollten Infrastrukturinvestitionen zu Überkapazitäten führen, und verwies auf eine starke Inbound-Nachfrage externer Unternehmen, die Zugang zu Metas API und Computerressourcen suchen.

5. Morgan Stanley: „Hyperscaler-CapEx ist keine Kostenlast — es ist ein Umsatzbeschleuniger“

• Kernaussagen

„Wir schätzen, dass Hyperscaler 2026 etwa 14 GW und 2027 etwa 20 GW neue Kapazität hinzufügen werden.“

„Bis 2027 wird AWS schätzungsweise etwa 14 Mrd. USD inkrementellen Umsatz pro neuem GW generieren, und Google Cloud etwa 11 Mrd. USD.“

„Morgan Stanley schätzt das AWS-Umsatzwachstum auf 35% im Jahr 2026 und 36% im Jahr 2027, und das Google Cloud-Wachstum auf 77% im Jahr 2026 und 86% im Jahr 2027.“

„Branchengespräche deuten auch darauf hin, dass neue Kapazitätsverträge zu Umsatz-Benchmarks von über 20 Mrd. USD pro GW diskutiert werden.“

• Erwartete Auswirkungen

Die zentrale Debatte rund um KI-Infrastrukturinvestitionen ist, ob die astronomischen CapEx der Hyperscaler tatsächlich in Umsatz umgewandelt werden können. In seinem Bericht vom 27. Mai antwortete Morgan Stanley: „Das ist möglich — und die aktuellen Prognosen sind wahrscheinlich konservativ.“

Der Kernrahmen ist „Umsatz pro GW.“ Morgan Stanley schätzt, dass Hyperscaler im Jahr 2026 etwa 14 GW und im Jahr 2027 etwa 20 GW neue Kapazität hinzufügen. Davon wird die für Public-Cloud-Geschäfte zugewiesene Kapazität auf etwa 6 GW im Jahr 2026 und 8 GW im Jahr 2027 geschätzt. Gemessen am Umsatz generiert AWS bis 2027 etwa 14 Mrd. USD inkrementellen Umsatz pro neuem GW und Google Cloud etwa 11 Mrd. USD. Branchengespräche deuten darauf hin, dass neue Kapazitätsverträge zu über 20 Mrd. USD pro GW diskutiert werden, was darauf hindeutet, dass diese Schätzungen konservativ sein könnten. Im Gegensatz zu Neo-Cloud-Betreibern, die hauptsächlich Bare-Metal-GPU-Vermietung anbieten, bündeln Hyperscaler Software und Plattformdienste, um Premium-Umsätze zu erzielen.

Die Wachstumsprognosen sind ebenfalls stark. AWS wird voraussichtlich von etwa 20% im Jahr 2025 auf 35% im Jahr 2026 und 36% im Jahr 2027 reakkelerieren, während Google Cloud auf 77% im Jahr 2026 und 86% im Jahr 2027 prognostiziert wird. Morgan Stanley stellte fest, dass die Google Cloud-Zahlen externe TPU-Verkäufe ausschließen, was bedeutet, dass das Potenzial für Aufwärtskorrekturen dort am größten ist. Das Bull-Case-Kursziel für Alphabet wurde von 425 USD auf 460 USD erhöht, und Amazons Kursziel liegt bei 330 USD. Die Schlussfolgerung ist, dass 2026–2027 den Zeitraum darstellt, in dem CapEx-Backlogs in die Gewinn- und Verlustrechnung einfließen, was einen Übergang von einer Kostenlastphase zu einer Umsatzbeschleunigungsphase für Hyperscaler-Investitionszyklen markiert.

6. JP Morgan: Globaler Speichermarkt soll bis 2028 1,7 Billionen USD erreichen

• Kernaussagen

„Wir haben unser FY26E–28E Speicher-TAM um 37–53% gegenüber unserem Modell vom März 2026 angehoben und erwarten, dass sich das Angebotsdefizit verschlechtern wird.“

„Der Anstieg der DRAM/NAND-Preise in diesem Jahr um 220–250% im Jahresvergleich könnte im nächsten Jahr zusätzliches Preisaufwärtsrisiko hinzufügen.“

„Wir sehen, dass der HBM-Allokationsanteil der DRAM-Wafer-Kapazität von 24% im Jahr 2026E auf 31% im Jahr 2028E weiter steigen wird.“

„JP Morgan schätzt die Gesamtinvestitionen in den nächsten drei Jahren auf 450 Mrd. USD, angehoben von 300 Mrd. USD im Dezember 2025-Modell.“

„Während Speicher in den frühen Phasen der KI einen mittleren Teenagerprozentsatz des gesamten CSP-Hardware-CapEx ausmachte, wird erwartet, dass er in diesem Jahr die Hälfte übersteigen wird.“

• Erwartete Auswirkungen

JP Morgans globaler Speicherbericht vom 29. Mai prognostiziert das 2028 Speichermarkt-TAM auf 1,7 Billionen USD und 2027 auf 1,3 Billionen USD — eine 37–53% übergreifende Aufwärtsrevision gegenüber dem März-Modell. Die Kernthese ist ein struktureller Wandel in der Zusammensetzung der Speichernachfrage.

Da sich die KI-Nachfrage von GPUs auf CPUs insgesamt ausbreitet, wächst der Speicherverbrauch schneller als erwartet. Da sich das GPU-zu-CPU-Verhältnis von 5,4:1 im Jahr 2023 auf 2,4:1 im Jahr 2028 verschieben soll, ist dies zu einem Faktor geworden, der eine zusätzliche Aufwärtsrevision von 20–22% bei der FY27E–28E Server-DDR/LPDDR5-Bit-Nachfrage antreibt. Die KI-CPU-DRAM-Nachfrage wird auf 11 Millionen GB in FY27E und 17 Millionen GB in FY28E projiziert, was 19% bzw. 24% der gesamten Marktnachfrage entspricht.

Angebotsseitige strukturelle Engpässe werden ebenfalls bestätigt. Da der Bau neuer Fabs mindestens drei Jahre dauert, werden 60% der inkrementellen DRAM-Wafer HBM zugewiesen, was zu einem doppelten Engpass bei der Standard-DRAM-Versorgung führt. Der HBM-Allokationsanteil soll von 24% im Jahr 2026 auf 31% im Jahr 2028 steigen, und die Gesamtinvestitionen in den nächsten drei Jahren wurden von 300 Mrd. USD auf 450 Mrd. USD erhöht — dennoch bleiben EUV-Beschaffung und Infrastrukturaufbau die wichtigsten Engpässe.

Bei den Preisen sind die DRAM/NAND-Preise in diesem Jahr bereits um 220–250% im Jahresvergleich gestiegen, mit weiterem Aufwärtsrisiko für das nächste Jahr. Der HBM-ASP soll auf vergleichbarer Basis um 10% und auf gemischter Basis um 30% im Jahresvergleich steigen. Der Speicheranteil am CSP-Hardware-CapEx ist von einem mittleren Teenagerprozentsatz in den frühen Phasen der KI auf über 50% in diesem Jahr gestiegen. JP Morgan kommt zu dem Schluss, dass die Speicherindustrie einen strukturellen Wandel von einem zyklischen Rohstoff zu einem strategischen Asset der KI-Infrastruktur durchläuft, wobei die Verbreitung von LTAs institutionelle Unterstützung für diese Neubewertung bietet.

Kommentar [0]

Schreibe einen Kommentar