Digital

Perplexity verteilt automatisiert KI-Rechenbedarf zwischen Gerät und Cloud

Perplexitys neuer Hybrid Inference Orchestrator verteilt KI-Rechenaufgaben automatisch zwischen Gerät und Cloud – für mehr Speed, Datenschutz und Akkulaufzeit.

Von ZenNews24 Redaktion 08.06.2026, 06:53 Uhr 4 Min. Lesezeit Aktualisiert: 24.06.2026

Perplexity verteilt automatisiert KI-Rechenbedarf zwischen Gerät und Cloud

Das Wichtigste in Kürze

Das KI-Start-up Perplexity hat eine Technologie angekündigt, die grundlegend verändern soll, wie KI-Anwendungen Rechenaufgaben bewältigen: Der sogenannte „Hybrid Inference Orchestrator" verteilt KI-Aufgaben automatisch zwischen dem lokalen Endgerät und Cloud-Servern
Das System verspricht messbare Verbesserungen bei Antwortgeschwindigkeit, Energieverbrauch und Datenschutz –…

Das KI-Start-up Perplexity hat eine Technologie angekündigt, die grundlegend verändern soll, wie KI-Anwendungen Rechenaufgaben bewältigen: Der sogenannte „Hybrid Inference Orchestrator" verteilt KI-Aufgaben automatisch zwischen dem lokalen Endgerät und Cloud-Servern. Das System verspricht messbare Verbesserungen bei Antwortgeschwindigkeit, Energieverbrauch und Datenschutz – allerdings sind die bisher veröffentlichten Leistungszahlen ausschließlich interne Schätzungen von Perplexity und wurden noch nicht durch unabhängige Dritte verifiziert.

Die dynamische Aufteilung von Rechenaufgaben zwischen Edge-Geräten und Cloud ist als Konzept nicht neu. Neu ist jedoch der Ansatz, diese Verteilung vollständig automatisiert und in Echtzeit vorzunehmen – ohne manuelle Konfiguration durch den Nutzer. Damit positioniert sich Perplexity im wachsenden Markt für sogenannte hybride KI-Inferenz, in dem auch Apple, Google und Qualcomm aktiv sind.

▶ Auf einen Blick

Perplexity stellt eine KI-Technologie zur automatischen Verteilung von Rechenaufgaben vor.
Das System verbessert Antwortgeschwindigkeit, Energieverbrauch und Datenschutz.
Perplexity agiert im Markt für hybride KI-Inferenz mit großen Konzernen.

Wie der Hybrid Inference Orchestrator funktioniert

KI-Modelle benötigen zur Ausführung erhebliche Rechenleistung. Bislang liefen solche Modelle entweder vollständig lokal auf dem Endgerät – mit entsprechend hohen Hardware-Anforderungen – oder komplett in der Cloud, was Latenzen erzeugt und Datenschutzfragen aufwirft. Der Hybrid-Ansatz verbindet beide Welten.

Perplexitys Orchestrator zerlegt KI-Aufgaben in einzelne Teilschritte und bewertet für jeden Schritt, ob lokale Ausführung oder Cloud-Verarbeitung effizienter ist. Dabei fließen mehrere Parameter in die Entscheidung ein: die aktuelle CPU- und GPU-Auslastung des Geräts, die verfügbare Netzwerkbandbreite, die Verbindungslatenz zur Cloud, der Stromverbrauch sowie die Rechenanforderungen des jeweiligen Modellschritts.

Ein konkretes Beispiel verdeutlicht das Prinzip: Bei einer Anfrage an ein Sprachmodell könnte die Vorverarbeitung der Nutzereingabe lokal stattfinden, die eigentliche Sprachanalyse in der Cloud und die abschließende Zusammenfassung der Antwort wieder lokal. Dieses Muster passt sich dynamisch an – abhängig davon, ob das Gerät gerade unter Last steht oder die Netzwerkverbindung schwächelt.

📩

Immer informiert bleibenDie wichtigsten Nachrichten, wenn sie erscheinen.

Newsletter holen

Technische Architektur: Reinforcement Learning trifft Edge Computing

Die Aufteilungslogik basiert auf Reinforcement Learning: Der Orchestrator wird darauf trainiert, aus seinen eigenen Entscheidungen zu lernen und die Verteilungsstrategie kontinuierlich zu verfeinern. Ergänzend setzt Perplexity einen prädiktiven Algorithmus ein, der Ressourcenengpässe antizipieren und Aufgaben präventiv umleiten soll – bevor es zu spürbaren Verzögerungen kommt.

Für zeitkritische Operationen greift das System auf Edge-Computing-Prinzipien zurück: Aufgaben, bei denen jede Millisekunde zählt, werden bevorzugt lokal ausgeführt. Rechenintensive, aber latenztolerante Aufgaben wandern in die Cloud. Die Kommunikation zwischen Gerät und Server ist komprimiert und priorisiert, um Bandbreite zu schonen.

Ob das Reinforcement-Learning-Modell selbst auf dem Gerät oder in der Cloud trainiert wird und wie groß dessen Rechenoverhead ist, hat Perplexity bislang nicht offengelegt. Diese Fragen sind technisch relevant, da ein schlecht optimiertes Meta-Modell den Effizienzgewinn des Orchestrators zunichtemachen könnte.

Kerndaten zum Hybrid Inference Orchestrator
Entwickler: Perplexity AI
Verfügbarkeit: Rollout ab dem nächsten Quartal (genaues Datum nicht kommuniziert)
Unterstützte Plattformen: iOS, Android, macOS, Windows
Erwartete Performance-Verbesserung: 35–45 % schnellere Antwortzeiten auf Mobilgeräten (interne Perplexity-Daten, nicht unabhängig geprüft)
Erwartete Energieeinsparung: 30–40 % weniger Akkuverbrauch bei intensiver Nutzung (interne Perplexity-Daten)
Latenzreduktion: Durchschnittlich 200–300 ms gegenüber rein Cloud-basierter Verarbeitung (interne Perplexity-Daten)
Datenschutz: Sensible Daten können vollständig lokal verarbeitet werden – abhängig von Geräte-Hardware
Preismodell: Noch nicht kommuniziert

Vorteile für Nutzer – und ihre Grenzen

Für Endnutzer ergeben sich aus dieser Technologie drei zentrale Vorteile – mit jeweils relevanten Einschränkungen.

Performance: Schnellere Antwortzeiten entstehen vor allem dann, wenn die Netzwerkverbindung instabil oder die Cloud-Latenz hoch ist. In Umgebungen mit stabiler Hochgeschwindigkeitsverbindung dürfte der Unterschied geringer ausfallen. Die kommunizierten 35–45 % Verbesserung sind zudem unter optimierten Testbedingungen gemessen worden – reale Nutzungsszenarien variieren stark.

Akkulaufzeit: Die behauptete Reduktion des Akkuverbrauchs um 30–40 % klingt substanziell, ist aber stark geräteabhängig. Auf neueren Geräten mit dedizierten Neural-Processing-Units (NPUs) – wie dem Apple A17 Pro oder Qualcomms Snapdragon 8 Gen 3 – ist lokale KI-Inferenz besonders energieeffizient. Auf älteren Geräten ohne NPU kann lokale Verarbeitung hingegen den Akku stärker belasten als ein schlanker Cloud-Request.

Datenschutz: Lokal verarbeitete Daten verlassen das Gerät nicht – das ist ein echter Vorteil gegenüber rein Cloud-basierten Lösungen. Allerdings gilt dies nur für jene Teilschritte, die tatsächlich lokal ausgeführt werden. Welche Daten in welchem Schritt die Cloud erreichen, bleibt für den Nutzer ohne tiefere Einsicht in die Orchestrierungslogik schwer nachvollziehbar.

Ob der Hybrid Inference Orchestrator in der Praxis hält, was Perplexity verspricht, wird sich erst nach dem Rollout zeigen – wenn unabhängige Tests und reale Nutzererfahrungen die internen Zahlen auf den Prüfstand stellen. Gelingt der Beweis, könnte die Technologie zum Referenzmodell für hybride KI-Inferenz werden und den Druck auf Mitbewerber wie Apple, Google und Qualcomm erhöhen, ähnlich transparente Benchmarks vorzulegen.

Mehr zum Thema

EinordnungPerplexitys Innovation ermöglicht eine effiziente Nutzung von KI-Modellen, indem Rechenaufgaben dynamisch zwischen Gerät und Cloud verteilt werden. Dies ist relevant für deutsche Leser, da es die Entwicklung von schnelleren und ressourcenschonenderen KI-Anwendungen vorantreibt.

ZenNews24 RedaktionUnabhängige Nachrichtenredaktion · Schwerpunkt: Technologie

Wie findest du das?

technologie

ZenNews24 Redaktion

Redaktion

Die ZenNews24-Redaktion berichtet rund um die Uhr über die wichtigsten Ereignisse aus Deutschland und der Welt. Unsere Journalistinnen und Journalisten recherchieren, analysieren und ordnen ein — unabhängig und verlässlich.

Quelle: AutoEditor/technologie