Digital

Google plant KI-Steuerung für Mac-Computer

Gemini soll künftig eigenständig Aufgaben auf Apple-Laptops ausführen können.

Von Markus Bauer 18.10.2025, 16:05 Uhr 7 Min. Lesezeit Aktualisiert: 08.05.2026

Google plant KI-Steuerung für Mac-Computer

Rund 100 Millionen Menschen weltweit nutzen täglich Apple-Geräte für ihre Arbeit — und Google möchte künftig direkt in diesen Alltag eingreifen. Der Konzern aus Mountain View arbeitet daran, seinen KI-Assistenten Gemini so weiterzuentwickeln, dass er eigenständig Aufgaben auf Mac-Computern übernehmen kann: Dateien verschieben, Formulare ausfüllen, Anwendungen steuern — alles ohne manuellen Eingriff des Nutzers.

Was Google mit „Computer Use" plant

Die Technologie dahinter trägt intern den Begriff „Computer Use" — ein Konzept, bei dem ein KI-System nicht nur Fragen beantwortet, sondern aktiv die Benutzeroberfläche eines Computers übernimmt. Konkret bedeutet das: Gemini soll die Maus bewegen, auf Schaltflächen klicken, Text eingeben und zwischen Programmen wechseln können — autonom, auf Basis von Nutzeranweisungen in natürlicher Sprache.

Das klingt nach Science-Fiction, ist technisch aber bereits in frühen Phasen erprobt. Anthropic, ein Konkurrent von Google, hat mit seinem Modell Claude eine ähnliche Funktion bereits öffentlich demonstriert. OpenAI verfolgt mit dem Operator-Werkzeug eine vergleichbare Richtung. Google befindet sich also in einem Wettrennen, das über klassische Chatbot-Funktionen weit hinausgeht.

Laut übereinstimmenden Berichten aus dem Technologieumfeld plant Google, diese Fähigkeit über den bestehenden Gemini-Dienst auszurollen — zunächst für macOS, möglicherweise später auch für andere Betriebssysteme. Eine offizielle Bestätigung oder ein konkreter Zeitplan liegt bislang nicht vor. Google hat sich dazu bisher nicht öffentlich geäußert.

Wer mehr über den grundlegenden Wettbewerb zwischen Google und OpenAI verstehen möchte, findet in unserem Hintergrundstück zu Googles KI-Strategie mit Bard und Gemini im Vergleich zu ChatGPT eine fundierte Einordnung der Ausgangslage.

Wie funktioniert KI-Computersteuerung technisch?

Ki Medizin Diagnose Computer Roentgen Krankenhaus Technologie Zukunft

Herkömmliche KI-Assistenten — also Sprachmodelle wie Gemini oder ChatGPT — arbeiten textbasiert. Sie empfangen eine Eingabe, verarbeiten sie und geben eine Antwort aus. Das ist ein geschlossener Kreislauf ohne Wirkung auf die Außenwelt.

„Computer Use"-Systeme funktionieren grundlegend anders. Sie sind sogenannte agentische Systeme — das bedeutet, sie können eigenständig handeln, nicht nur antworten. Die KI nimmt kontinuierlich Screenshots des Bildschirms auf, analysiert, was sie sieht, entscheidet auf Basis dieser visuellen Eingabe, welcher nächste Schritt sinnvoll ist, und führt ihn aus. Dieser Ablauf wiederholt sich, bis die Aufgabe erledigt ist.

Technisch spricht man dabei von sogenannten Multimodalen Modellen mit Agentic Capabilities. Multimodal bedeutet, dass das System nicht nur Text, sondern auch Bilder — also Bildschirminhalte — verstehen kann. Agentic Capabilities beschreibt die Fähigkeit, auf Basis dieser Wahrnehmung eigenständige Entscheidungen zu treffen und Aktionen auszulösen.

Abgrenzung zu klassischen Automationswerkzeugen

Viele Unternehmen setzen bereits auf sogenannte Robotic Process Automation (RPA) — Software, die repetitive Aufgaben wie das Ausfüllen von Formularen oder das Übertragen von Daten automatisiert. Der Unterschied zur KI-gestützten Computersteuerung ist jedoch erheblich: RPA-Systeme folgen starren, vorab programmierten Regeln. Ändert sich die Benutzeroberfläche eines Programms auch nur geringfügig, versagen sie oft.

KI-basierte Systeme wie das geplante Gemini-Feature sollen flexibel reagieren — ähnlich wie ein Mensch, der eine neue Situation einschätzt und sich anpasst. Diese Flexibilität ist der entscheidende Vorteil, bringt aber auch neue Risiken mit sich, auf die weiter unten eingegangen wird.

Warum ausgerechnet der Mac?

Die Entscheidung, mit macOS zu beginnen, ist strategisch bemerkenswert. Apple-Computer gelten als besonders stark verbreitet in kreativen Branchen, im Technologiesektor und unter zahlungskräftigen Privatkunden — genau die Zielgruppe, die Google für Premium-KI-Dienste gewinnen möchte. Laut Marktforschungsdaten von IDC hält Apple bei stationären und mobilen Arbeitsgeräten im gehobenen Preissegment einen überdurchschnittlich hohen Marktanteil in Westeuropa und Nordamerika.

Gleichzeitig ist macOS als Betriebssystem vergleichsweise standardisiert — anders als die fragmentierte Windows-Welt mit ihren unzähligen Gerätekonfigurationen. Das macht die Entwicklung und das Testen einer agentenbasierten KI-Integration einfacher.

Der Markt für KI-Agenten: Wo stehen wir?

Das Konzept autonomer KI-Agenten — also Systeme, die selbstständig handeln statt nur zu antworten — gilt derzeit als eine der wichtigsten Entwicklungsrichtungen der gesamten KI-Branche. Gartner bezeichnet autonome KI-Agenten als einen der zentralen Technologietrends der kommenden Jahre und erwartet, dass sie in Unternehmensumgebungen zunehmend repetitive Wissensarbeit übernehmen werden (Quelle: Gartner).

Bitkom schätzt, dass rund 70 Prozent der deutschen Unternehmen KI-basierte Automatisierung als strategisch relevant einstufen — aber erst ein Bruchteil hat entsprechende Systeme tatsächlich im Einsatz (Quelle: Bitkom). Der Markt für sogenannte KI-Agenten-Plattformen befindet sich damit noch in einer frühen, aber dynamischen Wachstumsphase.

Statista prognostiziert, dass der globale Markt für KI-gestützte Prozessautomatisierung bis zum Ende dieses Jahrzehnts auf über 25 Milliarden US-Dollar anwachsen könnte — ausgehend von einem deutlich niedrigeren Niveau noch vor wenigen Jahren (Quelle: Statista).

Kerndaten: Google entwickelt eine Funktion, die es dem KI-System Gemini ermöglicht, eigenständig Aufgaben auf Mac-Computern durchzuführen — durch visuelle Bildschirmanalyse und autonome Steuerung von Maus und Tastatur. Die Technologie heißt intern „Computer Use" und folgt ähnlichen Ansätzen von Anthropic (Claude) und OpenAI (Operator). Ein offizieller Launch-Termin steht nicht fest. Datenschutz- und Sicherheitsfragen sind ungeklärt. Marktforscher von Gartner und Bitkom stufen autonome KI-Agenten als einen der relevantesten Technologietrends der nächsten Jahre ein.

Vergleich: Wer bietet was im Bereich KI-Computersteuerung?

Anbieter	Produkt / Funktion	Status	Unterstützte Plattformen	Besonderheit
Google	Gemini „Computer Use"	In Entwicklung, kein offizielles Release	macOS (geplant)	Integration in bestehenden Gemini-Dienst angestrebt
Anthropic	Claude „Computer Use"	Öffentliche Beta verfügbar	Browser-basiert, Desktop (experimentell)	Erstes großes Modell mit öffentlich demonstrierter Bildschirmsteuerung
OpenAI	Operator	Früher Zugang für ausgewählte Nutzer	Web-Anwendungen im Browser	Fokus auf webbasierte Aufgaben wie Formulare und Buchungen
Microsoft	Copilot Actions	Teilweise verfügbar in Microsoft 365	Windows, Microsoft 365	Tief integriert in Office-Ökosystem; nutzt OpenAI-Technologie
Apple	Apple Intelligence / Siri-Erweiterungen	Teilweise verfügbar	macOS, iOS, iPadOS	Systemnahe Integration, strenger Datenschutzansatz mit On-Device-Verarbeitung

Datenschutz und Sicherheit: Die ungeklärten Fragen

So beeindruckend die technischen Möglichkeiten klingen — die Risiken sind erheblich und werden in der öffentlichen Debatte bislang zu wenig diskutiert. Ein KI-System, das kontinuierlich Screenshots analysiert und eigenständig Maus und Tastatur steuert, hat im Prinzip Zugriff auf alles, was auf dem Bildschirm sichtbar ist: Passwörter, Bankdaten, vertrauliche Geschäftsdokumente, private Nachrichten.

Die entscheidende Frage lautet: Wo werden diese Bildschirmdaten verarbeitet? Auf dem Gerät selbst — also ohne Datenübertragung an externe Server — oder in der Cloud? Apple setzt bei seiner eigenen KI-Strategie stark auf sogenannte On-Device-Verarbeitung, also lokale Berechnung direkt auf dem Gerät, um den Datentransfer zu minimieren. Ob Google einen ähnlichen Ansatz verfolgt oder Bildschirmdaten zur Verarbeitung an eigene Server sendet, ist bislang unbekannt.

Hinzu kommt das Risiko unbeabsichtigter Aktionen. Ein KI-System, das eigenständig klickt und Formulare ausfüllt, kann Fehler machen — und diese Fehler können schwerwiegende Folgen haben, etwa das unbeabsichtigte Versenden einer E-Mail, das Löschen von Dateien oder das Auslösen eines Kaufvorgangs. Ohne klare Rückfrage- und Bestätigungsmechanismen sind solche Szenarien realistisch.

Für Unternehmen kommen regulatorische Fragen hinzu. In der Europäischen Union unterliegt der Einsatz von KI-Systemen, die eigenständig in Arbeitsprozesse eingreifen, potenziell dem im Entstehen begriffenen EU AI Act — einem Regelwerk, das Hochrisiko-KI-Anwendungen strengen Anforderungen unterwirft.

Einordnung: KI als Werkzeug oder als Autopilot?

Die Entwicklung von KI-Agenten ist keine isolierte Nachricht aus dem Google-Konzern, sondern Teil eines tiefgreifenden Wandels in der Art, wie Technologieunternehmen KI positionieren. Der Schritt von einem Assistenten, der Fragen beantwortet, hin zu einem System, das eigenständig handelt, ist fundamental — und er verlangt eine andere gesellschaftliche und regulatorische Debatte als bisherige KI-Diskussionen.

Verwandte Entwicklungen zeigen, wie breit der Umbruch ist: Während Google Gemini auf den Mac bringt, investieren Konzerne und Investoren gleichzeitig massiv in Quantencomputing — eine Technologie, die langfristig die Rechengrundlage für KI-Systeme verändern könnte. Dazu passend: IBM und Google haben kürzlich historische Fortschritte im Bereich Quantencomputing gemeldet, die die Branche aufhorchen lassen. Und auch IBMs Ankündigung eines 100.000-Qubit-Systems zeigt, in welchen Dimensionen die Rechenleistung der Zukunft gedacht wird.

KI-gestützte Automatisierung greift unterdessen bereits in ganz andere Wirtschaftsbereiche über. So plant das Start-up Wonder, mithilfe von KI die Gründung von Restaurants zu demokratisieren — ein Beispiel dafür, wie weit KI-Agenten und Automatisierungslogiken über die Tech-Branche hinausdringen.

Selbst im Investitionsumfeld für Zukunftstechnologien zeigen sich neue Akteure: Die Schwarz-Gruppe — bekannt als Mutterkonzern von Lidl und Kaufland — investiert in das Quantencomputer-Startup Eleqtron, was zeigt, dass selbst traditionelle Handelskonzerne die technologische Transformation längst als strategische Priorität erkannt haben.

Was Nutzer jetzt wissen sollten

Für Mac-Nutzer bedeutet Googles Pläne zunächst: abwarten. Ein konkretes Produkt liegt nicht vor, ein Veröffentlichungsdatum ist nicht bekannt. Wer Gemini bereits nutzt, wird von dieser Funktion vorerst nichts bemerken.

Mittelfristig aber sollten Nutzerinnen und Nutzer beginnen, sich mit grundlegenden Fragen auseinanderzusetzen: Welchen KI-Systemen bin ich bereit, Zugriff auf meinen Bildschirm zu gewähren? Welche Aufgaben möchte ich delegieren — und welche nicht? Welche Daten sollen dabei die eigene Hardware verlassen?

IDC weist in aktuellen Analysen darauf hin, dass Vertrauen das zentrale Hindernis für die Adoption von KI-Agenten in privaten und geschäftlichen Umgebungen ist — mehr noch als Preis oder technische Reife (Quelle: IDC). Dieses Vertrauen müssen Anbieter wie Google erst noch aufbauen — durch Transparenz über Datenpraktiken, klare Kontrollmechanismen und die Möglichkeit, KI-Aktionen jederzeit zu pausieren oder rückgängig zu machen.

Die Nachricht, dass Google Gemini auf den Mac bringen will, ist weniger eine Ankündigung eines fertigen Produkts als ein Signal: Der Wettbewerb um die Kontrolle über den digitalen Arbeitsalltag der Menschen hat eine neue Stufe erreicht. Ob Nutzer davon profitieren oder vor allem Daten liefern, hängt davon ab, wie transparent und verantwortungsvoll die beteiligten Konzerne dabei vorgehen — und wie kritisch Verbraucherinnen und Verbraucher diese Entwicklung begleiten.

Mehr zum Thema

Weiterführende Informationen: BSI Bundesamt fuer Sicherheit

Quelle: t3n

Wie findest du das?

Markus Bauer

Technologie & Digitales

Markus Bauer verfolgt die Entwicklungen in Tech, KI und Digitalpolitik. Er analysiert, wie neue Technologien Gesellschaft und Wirtschaft verändern — von Datenschutz bis Plattformregulierung.

Quelle: t3n ↗