Digital

DeepSeek R1: Chinas KI erschüttert Silicon Valley

Wie ein chinesisches Modell ChatGPT und Gemini herausforderte

Von ZenNews24 Redaktion 21.02.2025, 11:45 Uhr 3 Min. Lesezeit Aktualisiert: 08.05.2026

DeepSeek R1: Chinas KI erschüttert Silicon Valley

China hat der globalen KI-Industrie einen Schock versetzt. DeepSeek R1, ein Sprachmodell des chinesischen Unternehmens DeepSeek, löste im Januar 2025 Schockwellen in Silicon Valley aus – nicht wegen bahnbrechender Innovationen im klassischen Sinne, sondern wegen eines viel beunruhigenderen Signals: Ein chinesisches Unternehmen hatte mit deutlich geringerem Budget und ohne Zugang zu den neuesten Nvidia-Chips ein KI-System geschaffen, das mit GPT-4o und Google Gemini in zentralen Benchmarks konkurrieren kann. Was zunächst wie eine technische Randnotiz wirkte, entwickelte sich innerhalb weniger Tage zur meistdiskutierten KI-Meldung seit dem ChatGPT-Launch 2022 – und erschütterte dabei die Börsenbewertungen ganzer Industrien.

Das Wichtigste in Kürze

DeepSeek R1: Warum das chinesische KI-Modell Silicon Valley unter Druck setzt
Chain-of-Thought und Reinforcement Learning: Die technische Grundlage von R1

Kerndaten DeepSeek R1 (Stand: Januar 2025)

Entwickler: DeepSeek AI (Hangzhou, China), gegründet 2023 als Ausgründung des quantitativen Hedgefonds High-Flyer Capital Management
Gründer: Liang Wenfeng, Mitgründer von High-Flyer, fungiert als CEO
Trainingskosten R1: DeepSeek selbst beziffert die reinen GPU-Kosten für das Vorläufermodell V3 auf ca. 5,576 Millionen US-Dollar – ein Wert, der in der Branche intensiv diskutiert wird, da er Infrastruktur- und Personalkosten ausklammert
Vergleichswert: OpenAI GPT-4 wurden Trainingskosten von geschätzt 100 Millionen US-Dollar oder mehr zugeschrieben (Quelle: diverse Branchenanalysen, u.a. SemiAnalysis)
Hardware: Training auf Nvidia H800-GPUs, nicht auf den exportgesperrten H100-Chips
Architektur: Mixture-of-Experts (MoE), ca. 671 Milliarden Parameter gesamt, davon rund 37 Milliarden pro Anfrage aktiv
Lizenz: MIT-Lizenz – vollständig Open Source, kommerzielle Nutzung erlaubt
Performance: Übertrifft GPT-4o und Claude 3.5 Sonnet auf AIME 2024 (Mathematik-Benchmark) sowie auf MATH-500; vergleichbar mit OpenAI o1 auf mehreren Reasoning-Benchmarks
App-Ranking: Platz 1 in den US-amerikanischen App-Stores (Apple und Google Play) in der Woche ab dem 27. Januar 2025

DeepSeek R1: Warum das chinesische KI-Modell Silicon Valley unter Druck setzt

Januar 2025 innerhalb eines einzigen Handelstages rund 593 Milliarden US-Dollar an Marktkapitalisierung – der größte Tagesverlust eines Einzelunternehmens in der Geschichte der US-Börsen.

Die Nervosität in den Vorstandsetagen von San Francisco bis Menlo Park war mit Zahlen messbar: Nvidia verlor am 27. Januar 2025 innerhalb eines einzigen Handelstages rund 593 Milliarden US-Dollar an Marktkapitalisierung – der größte Tagesverlust eines Einzelunternehmens in der Geschichte der US-Börsen. Der Auslöser war kein Produktfehler, keine Regulierung, sondern ein Forschungspapier und ein Open-Source-Modell aus Hangzhou. Das sagt mehr über die strukturelle Verwundbarkeit des KI-Ökosystems aus als jede Analystenprognose. Chinas technologischer Aufstieg zeigt sich dabei nicht nur in KI-Modellen, sondern stellt die gesamte westliche Innovationsdominanz in Frage.

DeepSeek und die Effizienz-Revolution: David gegen Goliath

Die Geschichte beginnt mit einer unbequemen Wahrheit für die Silicon-Valley-Elite: Effiziente KI-Entwicklung ist möglich ohne die astronomischen Budgets, auf die Venture-Capital-getriebene Unternehmen gesetzt haben. DeepSeek bewies dies mit einer Kombination aus cleverer Architektur und konsequenter Optimierung. Das Unternehmen nutzte sogenannte Mixture-of-Experts-Ansätze (MoE): Statt bei jeder A

Hintergründe und Einordnung

nfrage alle Modellparameter zu aktivieren, werden nur spezialisierte Teilnetzwerke – sogenannte Experten – zugeschaltet. Bei DeepSeek V3 und R1 sind das jeweils rund 37 von insgesamt 671 Milliarden Parametern. Der Effekt: deutlich geringerer Rechen- und Energieaufwand pro Anfrage, ohne spürbare Qualitätseinbußen bei den anvisierten Aufgaben.

Was international anfangs wenig beachtet wurde: DeepSeek war kein unbekannter Newcomer. Das Unternehmen existiert seit 2023, veröffentlichte zuvor bereits die Modelle DeepSeek-Coder und DeepSeek-V2 – letzteres erhielt in Fachkreisen Aufmerksamkeit für seine MoE-Effizienz. Erst R1, spezialisiert auf mehrstufiges logisches Denken, erlangte globale Aufmerksamkeit. Liang Wenfeng und sein Team erkannten ein strategisches Marktloch: Während andere Technologien aus dem Hype-Zyklus verschwinden, setzten OpenAI und Google auf immer größere Parametermengen – doch DeepSeek investierte in methodische Effizienz, also intelligenteres Problemlösen statt schiere Rechengröße.

Chain-of-Thought und Reinforcement Learning: Die technische Grundlage von R1

DeepSeek R1: Chinas KI erschüttert Silicon Valley

Reasoning statt Brute Force

Das zentrale Merkmal von DeepSeek R1 ist sein Fokus auf Chain-of-Thought-Reasoning (CoT). Das Modell beantwortet Fragen nicht direkt, sondern externalisiert seinen Denkprozess: Es schreibt sozusagen laut auf, wie es zu einer Antwort gelangt. Diese Transparenz des Denkwegs ermöglicht es dem Modell, komplexe mathematische Probleme zu lösen und logische Fehlschlüsse zu korrigieren – ähnlich wie bei der Aufdeckung von Bilanzskandale, wo die Nachverfolgung von Gedankenketten entscheidend ist. Der Trainingsprozess nutzte dafür Reinforcement Learning (RL): Das Modell wird nicht nur mit korrekten Antworten trainiert, sondern lernt aktiv, welche Denkwege zu gültigen Lösungen führen.

Lesen Sie auch

KI Künstliche Intelligenz ChatGPT Technologie

Z

ZenNews24 Redaktion

Redaktion

Die ZenNews24-Redaktion berichtet rund um die Uhr über die wichtigsten Ereignisse aus Deutschland und der Welt. Unsere Journalistinnen und Journalisten recherchieren, analysieren und ordnen ein — unabhängig und verlässlich.

Noch nicht entdeckt — Digital

Microsoft Edge: Passwörter im Klartext auslesbar12.05.2025
Metaverse: Zuckerbergs 10-Milliarden-Wette auf eine virtuelle23.12.2021
Pennsylvania verklagt Character.AI wegen Arzt-Betrug durch04.05.2025

Themen: KI Künstliche Intelligenz Mobilität ChatGPT Außenpolitik Umwelt Bundesliga USA CDU Bilanz Bayern Kosten Bundesregierung Ukraine Koalition SPD Druck Milliarden Rekord Boom Prozent Russland Trump Champions League