Microsoft Build 2026 u. a. (0603)

1. Microsoft Build 2026 — Vollständige Vorstellung eigener KI-Modelle und der Agentenplattform

• Kernaussagen

„Eigene Modellfamilie MAI vorgestellt. Enthält das Reasoning-Modell MAI-Thinking-1, das Bildgenerierungsmodell MAI-Image-2.5 sowie Sprach-, Transkriptions- und Coding-Modelle“

„MAI-Thinking-1 unterstützt 35 Milliarden aktive Parameter und einen 256K-Kontext. Behauptet Präferenzvorteil gegenüber Sonnet 4.6 und Coding-Leistung auf dem Niveau von Opus 4.6″

„Majorana 2 vorgestellt. Durchschnittliche Qubit-Kohärenzzeit von über 20 Sekunden, Zuverlässigkeit gegenüber der Vorgängergeneration um das 1.000-Fache verbessert. Ziel: Aufbau eines skalierbaren Quantencomputers bis 2029″

„KI-Agentenplattform-Strategie voll im Gange. GitHub, Foundry, Copilot, Windows und Azure sollen in einem einzigen Agenten-Stack integriert werden“

„Windows wird zur agentennnativen Plattform umgebaut. OS-Ebene Sandbox und Sicherheitsisolierung durch MXC (Microsoft Execution Containers)“

• Erwartete Auswirkungen

Das Kernthema von Build 2026 lässt sich in drei Bereiche gliedern.

Erstens: die Vorstellung der eigenen KI-Modellfamilie (MAI) zur Reduzierung der Abhängigkeit von OpenAI. MAI-Thinking-1 unterstützt 35 Milliarden aktive Parameter und einen 256K-Kontext. Microsoft behauptet einen Präferenzvorteil gegenüber Anthropics Sonnet 4.6 sowie eine Coding-Leistung auf dem Niveau von Opus 4.6. Da Microsoft bisher vollständig auf OpenAI-Modelle über Azure angewiesen war, stellt der Aufbau eines eigenen Modellportfolios einen strukturell bedeutsamen Wandel dar — insbesondere hinsichtlich der Verbesserung der Kostenstruktur von KI-Diensten und der Stärkung der Verhandlungsposition gegenüber Drittanbietern von Modellen.

Zweitens: eine umfassende Integrationsstrategie für die KI-Agentenplattform. Die Ankündigung, GitHub, Foundry, Copilot, Windows und Azure in einem einzigen Agenten-Stack zu bündeln, signalisiert Microsofts Absicht, sich vom Cloud- und SaaS-Anbieter zum Plattformbetreiber zu wandeln, der den gesamten KI-Workflow im Unternehmensbereich kontrolliert. Produkte wie Microsoft Scout (autonomer Arbeitsagent auf Basis von Teams und Outlook), Frontier Tuning (Reinforcement Learning mit internen Unternehmensdaten), Agent 365 und MDASH (Agenten-Governance und Sicherheit) sowie GitHub Copilot App (integrierte parallele Agenten-Entwicklung, Code-Review, CI und Merging) sind Produktlinien, die darauf ausgelegt sind, die Einstiegshürde für KI-Einführungen bei Unternehmenskunden zu senken und gleichzeitig den Lock-in-Effekt des Microsoft-Ökosystems zu verstärken. Die Umstellung von Windows auf eine agentennative Plattform mit OS-Ebene-Sandbox-Isolierung über MXC ist eine Strategie, um Agentenausführungsumgebungen auf Windows zu verlagern und dabei Unternehmens-Sicherheitsanforderungen zu erfüllen.

Drittens: die Ausweitung der Hardware-Strategie. Die Surface RTX Spark Dev Box (bis zu 1 PFLOPS KI-Leistung, 128 GB Unified Memory, lokale Ausführung von Modellen bis zu 120 Milliarden Parametern) ist ein kompakter Entwickler-PC von Microsoft, der auf NVIDIAs RTX Spark Superchip basiert, und zeigt die Richtung an, KI-Inferenz-Workloads teilweise vom Cloud in Richtung Edge und Endgeräte zu verlagern. Die Vorstellung einer Vorschauversion des Cobalt 200, eines selbst entwickelten KI-Server-Prozessors, durch den Microsoft-CEO deutet darauf hin, dass die Strategie zur Senkung der Cloud-Compute-Kosten durch Custom Silicon in die vollständige Umsetzungsphase eingetreten ist.

Auch die Vorstellung von Majorana 2 im Bereich Quantencomputing ist bemerkenswert. Eine durchschnittliche Qubit-Kohärenzzeit von über 20 Sekunden und eine gegenüber der Vorgängergeneration um das 1.000-Fache verbesserte Zuverlässigkeit zeigen, dass die technologische Reife rasch zunimmt. Microsoft hat das Ziel ausgegeben, bis 2029 einen skalierbaren Quantencomputer zu bauen.

Zusammenfassend könnte Build 2026 ein entscheidender Wendepunkt sein, an dem Microsoft die Abkehr von der Abhängigkeit von OpenAI-Modellen hin zur eigenen Modell-, Plattform- und Hardware-Vertikalintegration beschleunigt. Wenn die Leistung der eigenen Modelle ein Niveau erreicht, das mit externen Modellen wirklich konkurrieren kann, hat die KI-bezogene Rentabilitätsstruktur von Microsoft mittelfristig Verbesserungspotenzial.

2. OpenAI, Intelligence at Work — Vollständige Expansion in die Wissensarbeit

• Kernaussagen

„Codex WAU überschreitet 5 Millionen. Wachstum von mehr als dem 6-Fachen seit dem Start der Desktop-App im Februar. Wissensarbeiter machen nun etwa 20 % der Gesamtnutzer aus“

„Die Codex-Adoptionsgeschwindigkeit bei Wissensarbeitern ist mehr als 3-mal schneller als bei Entwicklern. Einzelne Nutzer wachsen ebenfalls mehr als 4-mal schneller als Entwickler“

„Die am schnellsten wachsenden Aufgaben bei Wissensarbeitern sind Datenanalyse (+110 % WoW), Recherche (+37 %) und die Erstellung von Wissensoutputs (+36 %)“

„Der entscheidende Verhaltenswandel ist paralleles Arbeiten. Etwa 50 % der Nutzer führen nun mehrere Codex-Aufgaben gleichzeitig aus, verglichen mit weniger als 33 % Mitte April“

„Die Anzahl der Unternehmenskunden übersteigt 2 Millionen und hat sich gegenüber dem Vorjahr verdoppelt. Der Unternehmensanteil am Gesamtumsatz liegt bei etwa 40 % und soll bis Jahresende 50 % erreichen“

• Erwartete Auswirkungen

Die zentrale Botschaft der Intelligence at Work-Veranstaltung von OpenAI ist, dass Codex sich rasch von einem Entwicklerwerkzeug zu einer KI-Plattform ausweitet, die Wissensarbeit umfassend ersetzen kann.

Erstens ist das Wachstumstempo außergewöhnlich. Die Codex WAU hat seit dem Start der Desktop-App im Februar um mehr als das 6-Fache zugelegt und 5 Millionen überschritten — seit Jahresbeginn entspricht dies einem Wachstum von etwa 400 %. Besonders bemerkenswert ist, dass das Wachstum nicht von Entwicklern getrieben wird. Nicht-Entwickler unter den Wissensarbeitern adoptieren Codex mehr als 3-mal schneller als Entwickler, und einzelne Nutzer wachsen mehr als 4-mal schneller. Dies zeigt, dass der Markt für Codex über den Markt für Entwicklerwerkzeuge hinaus auf den gesamten Markt für Wissensarbeit mit etwa 40 % der US-Arbeitnehmer, also 72 Millionen Menschen, ausgeweitet wird.

Zweitens ist der Verhaltenswandel der Nutzer struktureller Natur. Etwa 50 % der Nutzer führen nun mehrere Codex-Aufgaben gleichzeitig parallel aus — ein deutlicher Anstieg gegenüber weniger als 33 % Mitte April. OpenAI interpretiert dies als Signal dafür, dass Nutzer von individuellen Aufgabenausführern zu Orchestratoren werden, die mehrere KI-Workflows verwalten. Die am schnellsten wachsenden Anwendungsbereiche sind Datenanalyse (+110 % WoW), Recherche (+37 %) und Wissensoutput-Erstellung (+36 %), was zeigt, dass die Durchdringung weit über einfache Code-Erstellung hinaus auf die gesamte Kernwissensarbeit beschleunigt.

Drittens vollzieht sich ein Wandel in der Unternehmens-Umsatzstruktur. Die Anzahl der Unternehmenskunden hat 2 Millionen überschritten und sich gegenüber dem Vorjahr verdoppelt, wobei der Unternehmensanteil am Gesamtumsatz bei etwa 40 % liegt und bis Jahresende 50 % erreichen soll. In Verbindung mit der Einführung von sechs rollenspezifischen Plugins (Datenanalyse, Creative Production, Vertrieb, Produktdesign, börsennotierte Aktieninvestitionen und Investment Banking) sowie geplanten Ergänzungen in den Bereichen Unternehmensfinanzen, Recht und Marketing deutet dies auf die vollständige Umsetzung einer vertikalen SaaS-Strategie hin, die tief in spezifische Berufsfelder eindringt. Zudem ist die Integration von Codex in ChatGPT innerhalb der nächsten Wochen geplant, und angesichts einer ChatGPT WAU, die sich der 1-Milliarden-Marke nähert, könnte diese Integration die potenzielle Reichweite von Codex erheblich ausweiten.

Viertens sind Verbesserungen der Modelleffizienz ein wichtiges Signal. GPT-5.5 soll vergleichbare Ergebnisse mit etwa einem Drittel des Token-Verbrauchs des Vorgängers erzielen, und der Modell-Release-Zyklus wurde von durchschnittlich 15 Monaten auf etwa 6 Wochen verkürzt. Je höher die Token-Effizienz, desto geringer die Compute-Kostenlast von OpenAI, und es entsteht eine Struktur, in der mehr Kunden zu niedrigeren Preisen gewonnen werden können — was gleichzeitig Rentabilität und Markterweiterung unterstützt.

3. Anthropic, Erweiterung von Project Glasswing — KI-Cybersicherheit dringt in kritische Infrastruktur vor

• Kernaussagen

„Project Glasswing, ein auf Claude Mythos Preview basierendes Cybersicherheitsprogramm, wurde von 50 teilnehmenden Organisationen auf etwa 200 erweitert“

„Frühe Teilnehmerorganisationen haben bislang mehr als 10.000 hochgradige und kritische Schwachstellen entdeckt“

„Mehrere KI-Unternehmen werden voraussichtlich innerhalb der nächsten 6 bis 12 Monate Mythos-ähnliche Cyberfähigkeiten erlangen. Die Notwendigkeit, die Verteidigungssysteme zu stärken, wird betont“

„Der Kernengpass in der Cybersicherheit liegt nicht in der Entdeckung von Schwachstellen, sondern im Prozess der Überprüfung, Offenlegung und des Patchens“

„Anthropics neuestes KI-Modell Claude Mythos war seit Anfang April nur ausgewählten Partnern zugänglich, da es potenzielle Cyberbedrohungen auslösen könnte.“

• Erwartete Auswirkungen

Das Kernthema dieser Ankündigung ist zweigeteilt: dass Claude Mythos im Bereich Cybersicherheit greifbare Ergebnisse erzielt, und dass Anthropic rasch eine First-Mover-Position im KI-Sicherheitsmarkt aufbaut.

Erstens wurden die Cybersicherheitsfähigkeiten von Mythos im praktischen Einsatz validiert. Die 50 frühen Teilnehmerorganisationen von Project Glasswing haben bislang gemeinsam mehr als 10.000 hochgradige und kritische Schwachstellen identifiziert. Anthropic bewertet, dass der Kernengpass in der Cybersicherheit nicht in der Entdeckung von Schwachstellen liegt, sondern im Prozess der Überprüfung, Offenlegung und des Patchens, und stellte fest, dass Mythos nicht nur zur Schwachstellenerkennung, sondern auch für das Schreiben von Patches, Penetrationstests und die Automatisierung der Bedrohungserkennung eingesetzt wird. Dies zeigt, dass Mythos sich als Werkzeug etabliert, das den gesamten Sicherheits-Workflow abdeckt. Zudem wurde Claude Security vorgestellt — eine auf Claude Opus 4.8 basierende Lösung zur Code-Überprüfung und Patch-Vorschlag.

Zweitens sind Tempo und Umfang der Erweiterung der Teilnahme bemerkenswert. Die Anzahl der teilnehmenden Organisationen hat sich von 50 auf etwa 200 vervierfacht, wobei neue Teilnehmer Betreiber kritischer Infrastrukturen wie Strom, Wasser, Gesundheitswesen und Kommunikation aus mehr als 15 Ländern sowie wichtige Open-Source-Wartungsorganisationen umfassen. Bei der Markteinführung Anfang April war Mythos aufgrund potenzieller Cyberbedrohungen nur ausgewählten Partnern zugänglich, doch nach etwa zwei Monaten der Entwicklung von Gegenmaßnahmen wurde der Zugang auf mehr als 150 Partner in mehr als 15 Ländern ausgeweitet. KI-Sicherheitsplattformen, die bei Betreibern kritischer Infrastrukturen eingesetzt werden, weisen nach der Einführung typischerweise hohe Wechselkosten auf, weshalb Anthropics frühzeitige Referenzakkumulation in diesem Markt mittelfristig von großer Bedeutung ist.

Drittens ist auch Anthropics Sicht auf die sich verändernde Wettbewerbslandschaft bemerkenswert. Anthropic prognostiziert, dass mehrere KI-Unternehmen innerhalb der nächsten 6 bis 12 Monate Mythos-ähnliche Cyberfähigkeiten erlangen werden, und betont die Notwendigkeit, die Verteidigungssysteme zu stärken. Dies spiegelt ein Bewusstsein innerhalb der Branche wider, dass die Verbreitung KI-basierter Cyberangriffsfähigkeiten unmittelbar bevorsteht, und signalisiert gleichzeitig Anthropics strategische Absicht, eine dominante Position auf der Defensivseite des Ökosystems zu etablieren.

4. Palo Alto Networks FY3Q26-Ergebnisse — KI-Sicherheitsplattform gestaltet Wettbewerbslandschaft neu

• Kernaussagen

„Next-Generation Security (NGS) ARR erreichte 8,13 Milliarden Dollar, ein Anstieg von 60 % im Jahresvergleich, während der Umsatz um 31 % auf 3,0 Milliarden Dollar wuchs. Organisches NGS ARR, ohne Akquisitionseffekte, wuchs ebenfalls um 28 % auf 6,5 Milliarden Dollar und bestätigte eine starke Nachfrage in allen Regionen.“

„RPO (Verbleibende Leistungsverpflichtungen) wuchs im Jahresvergleich um 36 % auf 18,4 Milliarden Dollar, Current RPO wuchs ebenfalls um 34 % auf 8,3 Milliarden Dollar. Hardware-Backlog und Next-Generation Firewall (NGFW)-Aufträge stiegen ebenfalls um etwa 40 % und stärken die künftige Umsatzsichtbarkeit.“

„Prisma AIRS-Kundenzahl überschreitet 300, ARR von 100 Millionen Dollar innerhalb der nächsten Quartale erwartet. XSIAM ARR überstieg 600 Millionen Dollar, ein Wachstum von 100 % im Jahresvergleich. Chronosphere ARR überstieg 300 Millionen Dollar mit wachsender Adoption bei KI-nativen Kunden.“

„Die Integration von CyberArk und Chronosphere schreitet schneller voran als ursprünglich erwartet. Mehr als 1.000 Cross-Selling-Möglichkeiten sind entstanden, und das Management erwähnte, dass der Zeitplan zur Erreichung der Rentabilitätsziele um 3 bis 6 Monate vorgezogen werden könnte.“

„Der bereinigte Free Cash Flow (FCF) für Q3 betrug 910 Millionen Dollar. Der bereinigte FCF der letzten zwölf Monate erreichte 4,08 Milliarden Dollar mit einer FCF-Marge von 38,5 %.“

• Erwartete Auswirkungen

Die wichtigste Erkenntnis aus den FY3Q26-Ergebnissen von Palo Alto Networks ist, dass die KI-Sicherheitsplattform-Strategie beginnt, sich in Zahlen zu beweisen.

Erstens ist die Qualität des Wachstums hoch. Der Umsatz wuchs im Jahresvergleich um 31 % auf 3,0 Milliarden Dollar und übertraf den Konsens, während das NGS ARR um 60 % auf 8,1 Milliarden Dollar wuchs. Besonders bemerkenswert ist, dass das organische NGS ARR ohne Akquisitionseffekte ebenfalls um 28 % auf 6,5 Milliarden Dollar wuchs. Dies zeigt, dass die Grundstärke des Kerngeschäfts intakt ist und das Top-Line-Wachstum nicht ausschließlich auf M&A angewiesen ist. RPO wuchs ebenfalls um 36 % auf 18,4 Milliarden Dollar, was die künftige Umsatzsichtbarkeit erhöht.

Zweitens beschleunigt sich die Adoption der KI-Sicherheitsplattform-Produktpalette. Prisma AIRS überschritt 300 Kunden, XSIAM ARR wuchs um 100 % im Jahresvergleich auf 600 Millionen Dollar, und Chronosphere ARR weitete sich auf mehr als 300 Millionen Dollar aus. Diese drei Produkte decken jeweils KI-Bedrohungserkennung, KI-gesteuerte Security Operations (SOC)-Automatisierung und Observability ab. Je mehr KI-Infrastruktur sich ausweitet, desto größer wird auch die Angriffsfläche. Palo Alto Networks baut eine Position auf, die die Verteidigungsnachfrage gegenüber zunehmend ausgefeilten KI-basierten Angriffen intensiv absorbiert.

Drittens materialisieren sich die Synergien aus der Akquisitionsintegration schneller als erwartet. Die Akquisitionen von CyberArk und Chronosphere haben mehr als 1.000 Cross-Selling-Möglichkeiten generiert, und der Kommentar des Managements, dass der Zeitplan zur Erreichung der Rentabilitätsziele um 3 bis 6 Monate vorgezogen werden könnte, stärkt das Vertrauen in die Umsetzungsfähigkeit. Die jährliche NGS ARR-Guidance für FY26 wurde auf 8,9 bis 8,95 Milliarden Dollar angehoben, und die Umsatz-Guidance wurde auf 11,415 bis 11,425 Milliarden Dollar erhöht.

Es gibt jedoch auch Risikofaktoren. Die Hardwarepreise wurden aufgrund steigender Speicher- und Storagekosten um etwa 10 % erhöht, und die akquisitionsbezogene aktienbasierte Vergütung (SBC) stieg auf etwa 17 % des Umsatzes, sodass das Unternehmen auf GAAP-Basis nach wie vor einen Nettoverlust (-0,22 Dollar je Aktie) ausweist. Der wachsende Anteil von Großverträgen — darunter ein KI-Forschungslabor-Vertrag über 200 Millionen Dollar und ein Versorgungsunternehmen-Vertrag über 80 Millionen Dollar — bedeutet, dass das Ausführungsrisiko mit der Vertragsgröße zunimmt, was eine laufende Beobachtung erfordert.

5. SK Hynix, DRAM-Produktionskapazität soll bis 2030 verdoppelt werden

• Kernaussagen

„SK Group-Vorsitzender Chey Tae-won legte einen Plan vor, SK Hynix’s DRAM WSPM in den nächsten fünf Jahren zu verdoppeln.“

„SK Hynix verfügte Ende 2025 über 530.000 DRAM WSPM, davon 350.000 in Korea und 180.000 in China. Wir erwarten Ende 2028 745.000 und Ende 2029 865.000.“

„Im Basisszenario von JPMorgan wird der Versorgungsengpass 2027 schlimmer sein als 2026, und der absolute Versorgungsengpass wird voraussichtlich bis 2028 andauern.“

„Unserer Ansicht nach werden im Zeitraum 2028–2030 weit mehr als 50 EUV-Anlagen benötigt, und SK Hynix‘ offizielles Zieldatum für die Fertigstellung der Infrastruktur ist Dezember 2030.“

„Die Aussage von SK Hynix-Vorsitzendem Chey, dass Speicher-Versorgungsengpässe bis 2030 anhalten werden, wurde ebenfalls positiv aufgenommen.“

• Erwartete Auswirkungen

Die Ankündigung von Vorsitzendem Chey Tae-won ist nicht nur eine bloße Offenlegung von Investitionsplänen, sondern als direkte Bestätigung der Perspektive des Top-Managements eines führenden Speicheranbieters auf die Branchenlage bemerkenswert. JPMorgan zitierte und bewertete die Aussagen des Vorsitzenden direkt.

Erstens sind Umfang und Zeitplan des Erweiterungsplans konkret. SK Hynix‘ DRAM WSPM lag Ende 2025 bei 530.000 Wafern. JPMorgan prognostiziert eine schrittweise Erweiterung auf 745.000 bis Ende 2028 und 865.000 bis Ende 2029, wobei die Kapazität 1 Million Wafer überschreiten soll, sobald die erste Phase des Yongin-Clusters bis Ende 2030 vollständig belegt ist. Dies entspricht einem Plan, die Produktionskapazität in den nächsten fünf Jahren etwa zu verdoppeln. JPMorgan wies jedoch darauf hin, dass die Realisierung dieses Plans von der Lösung von Variablen abhängt, darunter die Beschaffung von weit mehr als 50 EUV-Anlagen und der Aufbau der EPC-Infrastruktur im Zeitraum 2028–2030.

Zweitens interpretiert JPMorgan diese Erweiterung als Reaktion auf Versorgungsengpässe und nicht als Peak-Out-Signal. Historisch gesehen wurden Ankündigungen großer Kapazitätserweiterungen durch Speicheranbieter von den Märkten oft negativ aufgenommen. JPMorgan erwartet jedoch, dass der Versorgungsengpass 2027 gegenüber 2026 schlimmer wird und der absolute Versorgungsengpass bis 2028 anhält, und charakterisiert diese Erweiterung daher als unvermeidliche Reaktion, um mit der Nachfrage Schritt zu halten. Die direkte Aussage von Vorsitzendem Chey, dass Speicher-Versorgungsengpässe bis 2030 anhalten werden, stimmt mit der Sichtweise von JPMorgan überein.

6. TrendForce — HBM: Rentabilitätsumkehr 2026, Preisanstiegsstruktur für 2027 nimmt Form an

• Kernaussagen

„Ab dem ersten Quartal 2026 ist der Wafer-Erlös von HBM unter den von DDR5 64GB RDIMMs gefallen. Infolgedessen passen Lieferanten die Produktionsanteile zwischen HBM und konventionellem DRAM an, um die Rentabilität zu schützen.“

„Der ‚Crowding-out-Effekt‘, bei dem größere Die-Größen und wachsende Nachfrage die Produktionskapazität für konventionelles DRAM verdrängen, wird sich 2027 voraussichtlich weiter verschärfen. Dies gibt Lieferanten eine starke Grundlage, um in den HBM-Vertragsverhandlungen 2027 deutliche Preiserhöhungen durchzusetzen.“

„HBM-Kapazität pro KI-ASIC steigt von bisher 96 GB–192 GB auf 216 GB–288 GB“

„NVIDIA Rubin Ultra wird die HBM-Kapazität pro GPU voraussichtlich auf 384 GB ausweiten“

„HBM-Wafer-Input-Anteil: Ende 2025: 18 %, Ende 2026: 22 %, Ende 2027: 30 %“

• Erwartete Auswirkungen

Das Kernthema der TrendForce-Analyse ist, dass sowohl der Anreiz der Lieferanten zur Preiserhöhung als auch der nachfrageseitige Druck im HBM-Markt gleichzeitig zunehmen.

Erstens stärkt die Rentabilitätsumkehr den Anreiz der Lieferanten zur Preiserhöhung. Ab dem ersten Quartal 2026 liegt der Wafer-Erlös von HBM unter dem von DDR5 64GB RDIMMs. Dies ist das Ergebnis der jährlichen Vertragsstruktur von HBM, die den starken Anstieg der konventionellen DRAM-Preise seit der zweiten Hälfte 2025 nicht unmittelbar widerspiegeln konnte. Da die HBM-Rentabilität nun unter der von konventionellem DRAM liegt, haben Samsung, SK Hynix und Micron starke Anreize, in den HBM4-Vertragsverhandlungen für 2027 deutliche Preiserhöhungen durchzusetzen. Die Rentabilitätsumkehr dient als strukturelle Grundlage, die Lieferanten nutzen können, um Preiserhöhungen im Jahr 2027 zu rechtfertigen.

Zweitens steigt auf der Nachfrageseite der HBM-Inhalt pro Chip mit jeder Generation stark an. Im Jahr 2026 sind KI-ASICs der primäre Treiber des Nachfragewachstums, wobei die HBM-Kapazität pro KI-Chip von 96 GB–192 GB auf 216 GB–288 GB steigt. Im Jahr 2027 wird erwartet, dass NVIDIAs Rubin Ultra-Plattform die HBM-Kapazität pro GPU auf 384 GB ausweitet, und wachsende Bereitstellungsmengen von KI-ASIC-Plattformen wie Google TPUs werden die HBM-Bit-Nachfrage voraussichtlich weiter beschleunigen.

Das Ergebnis dieser konvergierenden Drücke spiegelt sich direkt in der Produktionsanteilsprognose wider. Der Anteil von HBM am gesamten DRAM-Wafer-Input wird voraussichtlich von 18 % Ende 2025 auf 22 % Ende 2026 und 30 % Ende 2027 steigen, während der HBM-Anteil am gesamten DRAM-Bit-Angebot im gleichen Zeitraum von 8 % auf 13 % wächst. Je höher der Produktionsanteil von HBM steigt, desto stärker wird das Angebot an konventionellem DRAM verdrängt, was auch auf konventionelles DRAM aufwärtigen Preisdruck ausübt. Infolgedessen sind Lieferanten in einem Umfeld, in dem der Nachfragedruck das Angebot strukturell übersteigt, gut positioniert, um in den HBM4-Vertragsverhandlungen 2027 deutliche Preiserhöhungen durchzusetzen. Das günstige Angebot-Nachfrage-Umfeld für führende HBM-Lieferanten wie SK Hynix und Samsung wird voraussichtlich bis 2027 anhalten.

7. Marvell × NVIDIA, Optische Interkonnektivität kommt zum Durchbruch — ‚Kupferwand‘ erklärt

• Kernaussagen

„Compute (GPU) → Memory (HBM) → Konnektivität: Der nächste Engpass ist, wie schnell Daten bewegt werden können“

„Weltpremiere: 102,4-Tbps-KI-dedizierter Switch auf den Markt gebracht. 51,2T-CPO-Switch (16 × 3,2T optische Engines) live auf der Bühne vorgeführt. 1,6-Tbps-2nm-kohärente optische Lösung — Sampling noch in diesem Jahr erwartet (Weltpremiere)“

„Wo Kupfer möglich ist, Kupfer — wo nicht, Optik“ — Jensen Huang

„NVIDIAs 2-Milliarden-Dollar-Investition in Marvell bestätigt. Zusammenarbeit auf Optik, Siliziumphotonik und NVLink Fusion ausgeweitet“

• Erwartete Auswirkungen

Die zentrale Botschaft, die Marvell und NVIDIA gemeinsam auf dem Computex 2026 übermittelten, ist eine Erklärung, dass der nächste Engpass in der KI-Infrastruktur auf Konnektivität übergegangen ist.

Erstens schafft die Verlagerung des Engpasses eine neue Zone von Nutznießern. Marvell-CEO Matt Murphy präsentierte die Entwicklung der KI-Infrastruktur in drei Stufen: Compute (GPU) → Memory (HBM) → Konnektivität. Wenn NVIDIA und SK Hynix die repräsentativen Nutznießer der ersten beiden Stufen waren, die von GPUs und HBM dominiert wurden, dann werden in der Konnektivitätsstufe Unternehmen mit optischer Interkonnektivitätstechnologie strukturelle Vorteile erzielen. Marvell erklärte, sich seit Jahren auf diesen Übergang vorzubereiten, und NVIDIA bestätigte dies, indem es seine 2-Milliarden-Dollar-Investition in Marvell bekräftigte und den Kooperationsumfang auf Optik, Siliziumphotonik und NVLink Fusion ausweitete.

Zweitens formalisiert die Erklärung der ‚Kupferwand‘ die Unvermeidlichkeit des optischen Übergangs. Jensen Huang zog eine klare Grenze: „Wo Kupfer möglich ist, Kupfer — wo nicht, Optik.“ Bei der Verbindung auf Rack-Ebene stößt Kupfer bei zunehmenden Bandbreitenanforderungen an physikalische Grenzen, sodass der Übergang zur optischen Technologie unvermeidlich wird. Als Reaktion darauf brachte Marvell den weltweit ersten 102,4-Tbps-KI-dedizierten Switch auf den Markt und kündigte das Sampling der weltweiten ersten 1,6-Tbps-2nm-kohärenten optischen Lösung noch in diesem Jahr an. Die Lösungsarchitektur ist nach Entfernung strukturiert: MARVELL COLORZ 1600 (4. Generation Siliziumphotonik) für Verbindungen zwischen Rechenzentren (Hunderte bis Tausende von Kilometern) und PAM4-basierte leistungsoptimierte optische Links für Verbindungen innerhalb von Rechenzentren (bis zu ~500 m).

Jensen Huang bezeichnete Marvell als das „nächste Billionen-Dollar-Unternehmen“ und betonte, dass Konnektivität das wirklich unverzichtbare Element in Rechenzentren ist, in denen Rechenworkloads auf Tausende von Chips verteilt sind.

Kommentar [1]

Schreibe einen Kommentar