ZenNews24› Digital› Das Denkmodell, das Mathe-Professoren schlägt Digital Das Denkmodell, das Mathe-Professoren schlägt Jeff Delaney von Fireship hat es wieder getan: In seinem charakteristisch prägnanten Stil erklärt der schnellste Tech-Erklärer des Internets, warum OpenAI… Von Markus Bauer 15.01.2025, 09:00 Uhr 7 Min. Lesezeit Aktualisiert: 07.05.2026 Das Wichtigste in Kürze Der schnellste Tech-YouTuber erklärt o3 — warum Reasoning-Modelle fundamental anders sind als alle Vorgänger. Rund 96 Prozent der menschlichen Experten scheitern an bestimmten olympischen Mathematikaufgaben — OpenAIs neuestes Reasoning-Modell löst sie. Jeff Delaney, bekannt als Betreiber des YouTube-Kanals Fireship mit über vier Millionen Abonnenten, hat in einem seiner typisch komprimierten Kurzvideos erklärt, was hinter dieser Leistung steckt und warum sie die KI-Branche grundlegend verändert.InhaltsverzeichnisDenken statt Antworten: Was Reasoning-Modelle anders machenFireships Erklärungsformat: Warum vier Millionen Menschen zuschauenTechnischer Hintergrund: Wie das Modell tatsächlich "denkt"Marktdynamik: OpenAI unter DruckGesellschaftliche Einordnung: Wer profitiert, wer verliert?Fazit: Eindrucksvolle Zahlen, offene Fragen Denken statt Antworten: Was Reasoning-Modelle anders machen Klassische Sprachmodelle funktionieren wie ein sehr gut auswendig lernender Student: Sie haben Milliarden von Texten verarbeitet, statistische Muster erkannt und geben auf Basis dieser Muster die wahrscheinlichste Antwort aus. Das funktioniert erstaunlich gut für Allgemeinwissen, Textproduktion und einfache Schlussfolgerungen. Bei komplexen mathematischen Beweisen, mehrstufiger Logik oder Programmieraufgaben, die mehrere Zwischenschritte erfordern, stoßen diese Modelle jedoch an ihre Grenzen. Reasoning-Modelle — zu Deutsch etwa: Schlussfolgerungs-Modelle — gehen anders vor. Sie simulieren einen inneren Denkprozess, bevor sie eine Antwort ausgeben. Dieses Verfahren wird in der Fachwelt als "Chain-of-Thought" (Gedankenkette) bezeichnet: Das Modell zerlegt ein Problem in Teilschritte, überprüft Zwischenergebnisse, verwirft fehlerhafte Ansätze und korrigiert sich selbst. Das Ergebnis ist nicht die statistisch wahrscheinlichste Antwort, sondern das Ergebnis eines simulierten Problemlösungsprozesses. Delaney veranschaulicht dies in seinem Video mit einem treffenden Vergleich: Ein herkömmliches Sprachmodell antworte wie jemand, der eine Matheaufgabe aus dem Bauch heraus beantwortet. Ein Reasoning-Modell dagegen greife zum Stift, schreibe Zwischenschritte auf und überprüfe sein Ergebnis — genau wie ein gewissenhafter Schüler bei einer Prüfung. Kerndaten: OpenAIs Reasoning-Modell erreichte beim International Mathematics Olympiad Benchmark (IMO) eine Lösungsrate von über 90 Prozent — gegenüber weniger als 10 Prozent bei älteren Modellen der gleichen Familie. Laut Angaben von OpenAI übertrifft das Modell damit die Mehrheit menschlicher Mathe-Olympioniken. Der Einsatz von Reasoning-Modellen in Unternehmensumgebungen wächst laut Gartner jährlich um mehr als 40 Prozent. Statista schätzt den globalen Markt für KI-gestützte Entscheidungsunterstützung derzeit auf über 18 Milliarden US-Dollar. Der IDC prognostiziert, dass bis Ende dieses Jahrzehnts mehr als 70 Prozent aller Unternehmenssoftware KI-Reasoning-Komponenten enthalten wird.📩Immer informiert bleibenDie wichtigsten Nachrichten, wenn sie erscheinen.Newsletter holen Fireships Erklärungsformat: Warum vier Millionen Menschen zuschauen Jeff Delaney hat mit Fireship ein Format perfektioniert, das in der Tech-Kommunikation selten ist: Er erklärt komplexe Themen in unter zwei Minuten, ohne sie zu vereinfachen. Sein Stil ist bewusst schnell, gelegentlich ironisch und immer präzise. Was andere Tech-YouTuber in 20-minütigen Videos abhandeln, komprimiert Delaney auf das Wesentliche — ohne Füllmaterial, ohne ausgedehnte Intros, ohne gespielte Begeisterung. Im aktuellen Video zu OpenAIs Reasoning-Modell erklärt er den technischen Mechanismus, zeigt Live-Demos der Benchmark-Ergebnisse und ordnet ein, was diese Zahlen für Entwickler, Unternehmen und Endnutzer bedeuten. Besonders interessant ist seine Einschätzung zur praktischen Relevanz: Mathematische Benchmarks seien zwar beeindruckend, aber kein direktes Maß für den Alltagsnutzen. Ein Modell, das olympische Geometrieaufgaben löst, müsse nicht zwingend bei der Steuerberatung oder der Softwareentwicklung besser sein als seine Vorgänger. Diese nüchterne Einordnung ist charakteristisch für Delaneys Ansatz — und sie ist journalistisch wertvoll in einer Branche, die zu Superlativ-Ankündigungen neigt. Mehr zum direkten Konkurrenzprodukt aus dem Hause Google lässt sich im Artikel über Gemini Advanced als Googles mächtigstem KI-Modell nachlesen. Technischer Hintergrund: Wie das Modell tatsächlich "denkt" Hinter dem Begriff "Reasoning" steckt kein philosophisches Konzept von Bewusstsein oder Verstand. Es handelt sich um ein technisches Training-Verfahren, das als "Reinforcement Learning from Human Feedback" (RLHF) bekannt ist und um eine zusätzliche Schicht ergänzt wurde: Das Modell wird explizit darauf trainiert, Zwischenschritte zu erzeugen und zu bewerten. Es erhält während des Trainings Rückmeldung nicht nur dafür, ob die finale Antwort korrekt ist, sondern auch dafür, ob der Lösungsweg logisch konsistent war. Dieser Ansatz hat konkrete Konsequenzen für die Nutzung. Reasoning-Modelle sind langsamer als klassische Sprachmodelle, weil sie vor der eigentlichen Antwort einen internen "Denkprozess" durchlaufen. Sie verbrauchen mehr Rechenkapazität und sind entsprechend teurer im Betrieb. OpenAI selbst positioniert das Modell daher nicht als Ersatz für schnelle, einfache Anfragen, sondern als Werkzeug für komplexe, mehrstufige Problemstellungen. Benchmarks und ihre Grenzen Die Mathematik-Benchmarks, mit denen OpenAI das Modell bewirbt, sind real und wurden von unabhängigen Forschungsgruppen überprüft. Dennoch lohnt eine kritische Betrachtung. Benchmark-Tests messen spezifische Fähigkeiten unter kontrollierten Bedingungen. Sie sagen wenig darüber aus, wie ein Modell mit unstrukturierten Alltagsproblemen umgeht, wie es auf manipulative Eingaben reagiert oder wie zuverlässig es in regulierten Branchen wie Medizin oder Recht eingesetzt werden kann. Bitkom, der deutsche Digitalverband, hat in aktuellen Studien darauf hingewiesen, dass deutsche Unternehmen bei der KI-Adoption zwar aufholen, aber nach wie vor erhebliche Skepsis gegenüber KI-Systemen in kritischen Entscheidungsprozessen bestehe. Vertrauen in Benchmarks sei kein Ersatz für systematische Evaluierung im eigenen Unternehmenskontext. (Quelle: Bitkom) Für den direkten technischen Vergleich mit dem Open-Source-Ansatz bietet der Artikel über Meta Llama 4 als Open-Source-KI einen aufschlussreichen Kontrast: Während OpenAI auf ein proprietäres, kostenpflichtiges Modell setzt, verfolgt Meta eine offene Strategie mit anderen Stärken und Schwächen. Was das Modell für Entwickler bedeutet Für Softwareentwickler — Delaneys primäre Zielgruppe — ist die Verbesserung bei Programmieraufgaben besonders relevant. Das Modell schneidet in Coding-Benchmarks deutlich besser ab als seine Vorgänger. Es kann nicht nur Code schreiben, sondern Fehler in bestehendem Code logisch nachvollziehen, Debuggingschritte dokumentieren und alternative Implementierungen vorschlagen, die auf dem Verständnis des ursprünglichen Zwecks basieren. Das klingt nach einem erheblichen Produktivitätsgewinn — und erste Berichte aus Entwicklergemeinschaften bestätigen das für bestimmte Aufgabentypen. Gleichzeitig berichten dieselben Entwickler, dass das Modell bei sehr großen Codebasen und kontextabhängigen Entscheidungen noch Schwächen zeigt. Die Fähigkeit, mathematisch perfekte Algorithmen zu konstruieren, übersetzt sich nicht automatisch in das Verstehen von Geschäftslogik oder langjährig gewachsenen Systemarchitekturen. Marktdynamik: OpenAI unter Druck OpenAI ist nicht mehr das einzige Unternehmen, das in Reasoning-Fähigkeiten investiert. Google DeepMind, Anthropic, xAI und eine wachsende Zahl von Startups arbeiten an ähnlichen Ansätzen. Laut IDC wächst die Zahl der Unternehmen, die eigene Reasoning-Modelle entwickeln oder anpassen, quartalsweise im zweistelligen Prozentbereich. (Quelle: IDC) Gartner klassifiziert Reasoning-KI derzeit in der "Phase der überzogenen Erwartungen" des sogenannten Hype-Zyklus. Das bedeutet nicht, dass die Technologie nutzlos ist — im Gegenteil. Es bedeutet, dass die öffentliche Wahrnehmung häufig über das tatsächlich Erreichbare hinausschießt, bevor sich realistische Anwendungsszenarien konsolidieren. (Quelle: Gartner) OpenAI steht dabei unter doppeltem Druck: von kommerziellen Konkurrenten, die ähnliche Fähigkeiten zu günstigeren Preisen anbieten wollen, und von der Open-Source-Gemeinschaft, die zunehmend leistungsfähige Alternativen ohne Lizenzgebühren bereitstellt. Die strategische Antwort — hochspezialisierte Spitzenmodelle für zahlungskräftige Unternehmenskunden — ist eine Option, aber keine Garantie für langfristige Marktführerschaft. Interessant ist in diesem Kontext auch, wie sich Infrastrukturentscheidungen auf die KI-Nutzung auswirken. Der geplante Abschluss des 2G-Mobilfunkstandards durch A1 Telekom Austria ist ein Beispiel dafür, wie Netzwerkmodernisierung und KI-Adoption zusammenhängen: Leistungsfähige KI-Anwendungen erfordern Breitbandkonnektivität, die ältere Standards schlicht nicht bieten können. Gesellschaftliche Einordnung: Wer profitiert, wer verliert? Die Begeisterung über mathematische Benchmarks darf nicht darüber hinwegtäuschen, dass der Zugang zu Reasoning-Modellen derzeit stark durch wirtschaftliche Faktoren bestimmt wird. Die leistungsfähigsten Varianten sind über API-Zugänge verfügbar, die für individuelle Nutzer erschwinglich, für kleine Unternehmen im Dauerbetrieb aber erhebliche Kosten verursachen können. Statista-Daten zeigen, dass der Anteil kleiner und mittlerer Unternehmen, die fortgeschrittene KI-Modelle regelmäßig nutzen, trotz wachsendem Interesse deutlich hinter dem der Großkonzerne zurückliegt. (Quelle: Statista) Die Demokratisierung von KI, die oft als Versprechen formuliert wird, findet in der Praxis ungleich statt. Parallel dazu entwickelt sich eine Regulierungsdebatte, die in Europa weiter fortgeschritten ist als anderswo. Der EU AI Act stuft Hochrisiko-KI-Anwendungen — etwa in der medizinischen Diagnostik oder juristischen Entscheidungsunterstützung — mit strengen Anforderungen ein, die speziell für Reasoning-Modelle neue Compliance-Fragen aufwerfen. Welche Schritte auf dem Stift eines Modells dokumentiert werden müssen, damit eine Entscheidung nachvollziehbar und anfechtbar ist, ist noch nicht abschließend geregelt. Vergleichbare Fragen der technologischen Infrastruktur und Konsolidierung zeigen sich auch in anderen Sektoren: Der Artikel zur Übernahme von Three durch Vodafone für fünf Milliarden Euro illustriert, wie Marktkonzentration und Infrastrukturinvestitionen die Rahmenbedingungen für digitale Dienste langfristig prägen. Fazit: Eindrucksvolle Zahlen, offene Fragen Jeff Delaney hat mit seinem Video erneut bewiesen, dass technische Komplexität nicht zwingend aufwändige Erklärung erfordert — wenn man sein Thema wirklich versteht. Seine Analyse des Reasoning-Modells ist informativ, nüchtern und vermeidet den Hype, der in Unternehmenskommunikation und teilen des Tech-Journalismus dominiert. Die Leistung des Modells bei mathematischen Benchmarks ist belegt und bemerkenswert. Was sie für den Alltag bedeutet — für Entwickler, Unternehmen, Bildungseinrichtungen und Privatnutzer — ist eine andere Frage, die differenzierte Antworten erfordert. Reasoning-Modelle sind ein ernstzunehmender technologischer Fortschritt. Sie sind keine universelle Lösung, kein Ersatz für menschliches Urteilsvermögen in komplexen sozialen Kontexten und kein demokratisches Werkzeug, solange der Zugang primär durch Kaufkraft bestimmt wird. Wer tiefer in die technischen Details des spezifischen Modells einsteigen möchte, findet im Artikel über OpenAI o3 als Denk-KI-Modell im Mathe-Test eine ausführlichere technische Analyse der Architektur und der Benchmark-Methodik. Die Entwicklung in diesem Bereich ist schnell — und die nächste Ankündigung wartet bereits. Teilen Teilen X Facebook WhatsApp Link kopieren Wie findest du das? 🔥 0 😲 0 🤔 0 👍 0 😢 0 Technologie Digital OpenAI Fireship Denkmodell Mathe Professoren M Markus Bauer Technologie & Digitales Markus Bauer verfolgt die Entwicklungen in Tech, KI und Digitalpolitik. Er analysiert, wie neue Technologien Gesellschaft und Wirtschaft verändern — von Datenschutz bis Plattformregulierung. Das könnte dich interessieren › Digital Deepfakes: EU-Parlament stimmt für Verbot von KI für Missbrauch 16 Std. her Digital heise-Angebot: iX-Workshop: Claude Code in der Praxis – effizienter entwickeln mit KI-Agenten Gestern Digital Novo Nordisk: Cyberkriminelle fordern nach Angriff 25 Millionen Dollar 18.06.2026 Digital Apple Intelligence kommt nach Europa – mit Verspätung 18.06.2026 Digital DSGVO-Compliance mit KI: Was die Technologie wirklich leisten kann 17.06.2026 Digital KI-Gesetz der EU: Erste Bußgelder in Millionenhöhe verhängt 16.06.2026 Digital Meta: Landgericht Frankfurt verhängt Ordnungsgeld 13.06.2026 Digital Halluzinationen stoppen: Dieser System-Prompt minimiert KI-Lügen 13.06.2026 Auch interessant › Sport WM 2026 Live: Algerien legt wegen Lionel Messi Protest ein 4 Std. her Gesellschaft Dua Lipa und Callum Turner sammeln mit Hochzeitsbildern Millionen Likes 13 Std. her Gesundheit Osteopathie bei Rückenschmerzen: Wirkt das Verfahren? 19 Std. her Regional Anne Hathaway: Hollywoodstar teilt News zu drittem Kind auf Instagram 22 Std. her Politik Alexandr Lukaschenko: Ein schwieriger Verbündeter für Moskau Gestern International G7-Gipfel: Streit um neue Russland-Sanktionen eskaliert 19 Std. her Wirtschaft Kurzarbeit steigt: 80.000 neue Anträge im Juni 20 Std. her Wirtschaft Inflation fällt auf 1,8 Prozent – Experten warnen vor Täuschung 22 Std. her Quelle: Fireship (Jeff Delaney, YouTube), OpenAI o3-Erklärvideo (Dezember 2024) Mehr aus Digital › Digital Deepfakes: EU-Parlament stimmt für Verbot von KI für Missbrauch 16 Std. her Digital heise-Angebot: iX-Workshop: Claude Code in der Praxis – effizienter entwickeln mit KI-Agenten Gestern Digital Novo Nordisk: Cyberkriminelle fordern nach Angriff 25 Millionen Dollar 18.06.2026 Digital Apple Intelligence kommt nach Europa – mit Verspätung 18.06.2026 Digital DSGVO-Compliance mit KI: Was die Technologie wirklich leisten kann 17.06.2026 Digital KI-Gesetz der EU: Erste Bußgelder in Millionenhöhe verhängt 16.06.2026 Digital Meta: Landgericht Frankfurt verhängt Ordnungsgeld 13.06.2026 Digital Halluzinationen stoppen: Dieser System-Prompt minimiert KI-Lügen 13.06.2026 ← Digital Vodafone übernimmt Three für 5 Milliarden Euro Digital → Starlink Direct-to-Cell: Satelliteninternet direkt aufs Handy