ZenNews24› Digital› Perplexity verteilt automatisiert KI-Rechenbedarf… Digital Perplexity verteilt automatisiert KI-Rechenbedarf zwischen Gerät und Cloud Perplexitys neuer Hybrid Inference Orchestrator verteilt KI-Rechenaufgaben automatisch zwischen Gerät und Cloud – für mehr Speed, Datenschutz und Akkulaufzeit. Von ZenNews24 Redaktion 08.06.2026, 06:53 Uhr 3 Min. Lesezeit Das Wichtigste in Kürze Das KI-Start-up Perplexity hat eine Technologie angekündigt, die grundlegend verändern soll, wie KI-Anwendungen Rechenaufgaben bewältigen: Der sogenannte „Hybrid Inference Orchestrator" verteilt KI-Aufgaben automatisch zwischen dem lokalen Endgerät und Cloud-ServernDas System verspricht messbare Verbesserungen bei Antwortgeschwindigkeit, Energieverbrauch und Datenschutz –… Das KI-Start-up Perplexity hat eine Technologie angekündigt, die grundlegend verändern soll, wie KI-Anwendungen Rechenaufgaben bewältigen: Der sogenannte „Hybrid Inference Orchestrator" verteilt KI-Aufgaben automatisch zwischen dem lokalen Endgerät und Cloud-Servern. Das System verspricht messbare Verbesserungen bei Antwortgeschwindigkeit, Energieverbrauch und Datenschutz – allerdings sind die bisher veröffentlichten Leistungszahlen ausschließlich interne Schätzungen von Perplexity und wurden noch nicht durch unabhängige Dritte verifiziert. Die dynamische Aufteilung von Rechenaufgaben zwischen Edge-Geräten und Cloud ist als Konzept nicht neu. Neu ist jedoch der Ansatz, diese Verteilung vollständig automatisiert und in Echtzeit vorzunehmen – ohne manuelle Konfiguration durch den Nutzer. Damit positioniert sich Perplexity im wachsenden Markt für sogenannte hybride KI-Inferenz, in dem auch Apple, Google und Qualcomm aktiv sind.Lesen Sie auchMeta führt neue Bezahlangebote für Instagram, Facebook und WhatsApp einComputex: Acers MacBook-Neo-Antwort heißt Swift Air 14Deutschland: 54 Prozent der Firmen nutzen KI – doch kleine Betriebe hinken hinterher Wie der Hybrid Inference Orchestrator funktioniert KI-Modelle benötigen zur Ausführung erhebliche Rechenleistung. Bislang liefen solche Modelle entweder vollständig lokal auf dem Endgerät – mit entsprechend hohen Hardware-Anforderungen – oder komplett in der Cloud, was Latenzen erzeugt und Datenschutzfragen aufwirft. Der Hybrid-Ansatz verbindet beide Welten. Perplexitys Orchestrator zerlegt KI-Aufgaben in einzelne Teilschritte und bewertet für jeden Schritt, ob lokale Ausführung oder Cloud-Verarbeitung effizienter ist. Dabei fließen mehrere Parameter in die Entscheidung ein: die aktuelle CPU- und GPU-Auslastung des Geräts, die verfügbare Netzwerkbandbreite, die Verbindungslatenz zur Cloud, der Stromverbrauch sowie die Rechenanforderungen des jeweiligen Modellschritts. Ein konkretes Beispiel verdeutlicht das Prinzip: Bei einer Anfrage an ein Sprachmodell könnte die Vorverarbeitung der Nutzereingabe lokal stattfinden, die eigentliche Sprachanalyse in der Cloud und die abschließende Zusammenfassung der Antwort wieder lokal. Dieses Muster passt sich dynamisch an – abhängig davon, ob das Gerät gerade unter Last steht oder die Netzwerkverbindung schwächelt.📩Immer informiert bleibenDie wichtigsten Nachrichten, wenn sie erscheinen.Newsletter holen Technische Architektur: Reinforcement Learning trifft Edge Computing Die Aufteilungslogik basiert auf Reinforcement Learning: Der Orchestrator wird darauf trainiert, aus seinen eigenen Entscheidungen zu lernen und die Verteilungsstrategie kontinuierlich zu verfeinern. Ergänzend setzt Perplexity einen prädiktiven Algorithmus ein, der Ressourcenengpässe antizipieren und Aufgaben präventiv umleiten soll – bevor es zu spürbaren Verzögerungen kommt. Für zeitkritische Operationen greift das System auf Edge-Computing-Prinzipien zurück: Aufgaben, bei denen jede Millisekunde zählt, werden bevorzugt lokal ausgeführt. Rechenintensive, aber latenztolerante Aufgaben wandern in die Cloud. Die Kommunikation zwischen Gerät und Server ist komprimiert und priorisiert, um Bandbreite zu schonen. Ob das Reinforcement-Learning-Modell selbst auf dem Gerät oder in der Cloud trainiert wird und wie groß dessen Rechenoverhead ist, hat Perplexity bislang nicht offengelegt. Diese Fragen sind technisch relevant, da ein schlecht optimiertes Meta-Modell den Effizienzgewinn des Orchestrators zunichtemachen könnte. Kerndaten zum Hybrid Inference Orchestrator Entwickler: Perplexity AI Verfügbarkeit: Rollout ab dem nächsten Quartal (genaues Datum nicht kommuniziert) Unterstützte Plattformen: iOS, Android, macOS, Windows Erwartete Performance-Verbesserung: 35–45 % schnellere Antwortzeiten auf Mobilgeräten (interne Perplexity-Daten, nicht unabhängig geprüft) Erwartete Energieeinsparung: 30–40 % weniger Akkuverbrauch bei intensiver Nutzung (interne Perplexity-Daten) Latenzreduktion: Durchschnittlich 200–300 ms gegenüber rein Cloud-basierter Verarbeitung (interne Perplexity-Daten) Datenschutz: Sensible Daten können vollständig lokal verarbeitet werden – abhängig von Geräte-Hardware Preismodell: Noch nicht kommuniziert Vorteile für Nutzer – und ihre Grenzen Für Endnutzer ergeben sich aus dieser Technologie drei zentrale Vorteile – mit jeweils relevanten Einschränkungen. Performance: Schnellere Antwortzeiten entstehen vor allem dann, wenn die Netzwerkverbindung instabil oder die Cloud-Latenz hoch ist. In Umgebungen mit stabiler Hochgeschwindigkeitsverbindung dürfte der Unterschied geringer ausfallen. Die kommunizierten 35–45 % Verbesserung sind zudem unter optimierten Testbedingungen gemessen worden – reale Nutzungsszenarien variieren stark. Akkulaufzeit: Die behauptete Reduktion des Akkuverbrauchs um 30–40 % klingt substanziell, ist aber stark geräteabhängig. Auf neueren Geräten mit dedizierten Neural-Processing-Units (NPUs) – wie dem Apple A17 Pro oder Qualcomms Snapdragon 8 Gen 3 – ist lokale KI-Inferenz besonders energieeffizient. Auf älteren Geräten ohne NPU kann lokale Verarbeitung hingegen den Akku stärker belasten als ein schlanker Cloud-Request. Datenschutz: Lokal verarbeitete Daten verlassen das Gerät nicht – das ist ein echter Vorteil gegenüber rein Cloud-basierten Lösungen. Allerdings gilt dies nur für jene Teilschritte, die tatsächlich lokal ausgeführt werden. Welche Daten in welchem Schritt die Cloud erreichen, bleibt für den Nutzer ohne tiefere Einsicht in die Orchestrierungslogik schwer nachvollziehbar. Ob der Hybrid Inference Orchestrator in der Praxis hält, was Perplexity verspricht, wird sich erst nach dem Rollout zeigen – wenn unabhängige Tests und reale Nutzererfahrungen die internen Zahlen auf den Prüfstand stellen. Gelingt der Beweis, könnte die Technologie zum Referenzmodell für hybride KI-Inferenz werden und den Druck auf Mitbewerber wie Apple, Google und Qualcomm erhöhen, ähnlich transparente Benchmarks vorzulegen. Teilen Teilen X Facebook WhatsApp Link kopieren Wie findest du das? 🔥 0 😲 0 🤔 0 👍 0 😢 0 technologie Z ZenNews24 Redaktion Redaktion Die ZenNews24-Redaktion berichtet rund um die Uhr über die wichtigsten Ereignisse aus Deutschland und der Welt. Unsere Journalistinnen und Journalisten recherchieren, analysieren und ordnen ein — unabhängig und verlässlich. Das könnte dich interessieren › Digital Meta führt neue Bezahlangebote für Instagram, Facebook und WhatsApp ein 01.06.2026 Digital Computex: Acers MacBook-Neo-Antwort heißt Swift Air 14 02.06.2026 Digital Deutschland: 54 Prozent der Firmen nutzen KI – doch kleine Betriebe hinken hinterher 06.06.2026 Digital USA: Zwei Männer wegen Erstellung von KI-Deepfakes in New York angeklagt 04.06.2026 Digital Unix-Befehle nativ unter Windows: Microsoft veröffentlicht eigene Coreutils 04.06.2026 Digital Kein Patch reicht mehr: Wie ein KI-Wurm die IT-Sicherheit herausfordert 20 Std. her Digital Künstliche Intelligenz: Florida verklagt ChatGPT-Entwickler OpenAI und CEO Sam Altman Gestern Digital Quantencomputer knackt Bankverschlüsselung in Minuten Gestern Auch interessant › Sport Fußball-WM 2026: Darum ist Assan Ouédraogo dabei - und nicht Saïd El Mala 5 Std. her Politik Merz unter Druck: SPD fordert Kurswechsel bei Migrationspolitik 4 Std. her Klima Hitzesommer 2026: Experten warnen vor neuem Temperaturrekord 5 Std. her Gesundheit Pflegeversicherung: Pflegebedürftige erhalten oft keine Zahnvorsorge 17 Std. her Sport Leichtathletik: Owen Ansah verbessert deutschen 100-Meter-Rekord auf 9,98 Sekunden 23 Std. her Gesundheit Ebola: Hier kommt der infizierte US-Arzt in Berlin an Gestern International Ukraine: Kiew entschuldigt sich für sprengstoffbeladene Seedrohne vor Ferieninsel Gestern Unterhaltung Comeback der Legenden: ABBA-Hologramm-Tour kommt nach Deutschland 21 Std. her Quelle: AutoEditor/technologie Mehr aus Digital › Digital Kein Patch reicht mehr: Wie ein KI-Wurm die IT-Sicherheit herausfordert 20 Std. her Digital Quantencomputer knackt Bankverschlüsselung in Minuten Gestern Digital Künstliche Intelligenz: Florida verklagt ChatGPT-Entwickler OpenAI und CEO Sam Altman Gestern Digital Deutschland: 54 Prozent der Firmen nutzen KI – doch kleine Betriebe hinken hinterher 06.06.2026 Digital Unix-Befehle nativ unter Windows: Microsoft veröffentlicht eigene Coreutils 04.06.2026 Digital USA: Zwei Männer wegen Erstellung von KI-Deepfakes in New York angeklagt 04.06.2026 Digital OpenAI plant eigenes KI-Smartphone — ohne App Store 04.06.2026 Digital Computex: Acers MacBook-Neo-Antwort heißt Swift Air 14 02.06.2026 ← Digital Kein Patch reicht mehr: Wie ein KI-Wurm die IT-Sicherheit herausfordert