Apple, Google und Meta versuchen, ein Science-Fiction-Gadget zu perfektionieren: den Universalübersetzer

Seit Jahrzehnten werden in Serien wie „Star Trek“ und Romanen wie „Per Anhalter durch die Galaxis“ fiktive Universalübersetzer vorgestellt, die jede Sprache nahtlos ins Englische und umgekehrt konvertieren können.
Jetzt nähern sich diese Gadgets, die einst nur in Science-Fiction-Werken zu finden waren, der Realität.
Während der iPhone-Enthüllungsveranstaltung am Dienstag hat Apple Ein Video zeigte das Traumszenario vieler Reisender. Es zeigte einen englischsprachigen Touristen, der in einem nicht näher genannten spanischsprachigen Land Blumen kaufte. Der Florist sprach den Touristen auf Spanisch an, doch was der Tourist hörte, war klares, verständliches Englisch.
„Heute gibt es auf alle roten Nelken 50 % Rabatt“, hörte die Touristin auf Englisch über ihre Kopfhörer, praktisch zur gleichen Zeit, als der Verkäufer sprach.
Das Video war Marketingmaterial für Apples neueste AirPods Pro 3, aber die Funktion ist eine von vielen ihrer Art, die von Technologieunternehmen stammen, zu denen auch die Google-Muttergesellschaft Alphabet gehört. und Meta , das Facebook und Instagram macht.
Technologische Fortschritte, die durch die Einführung von OpenAIs ChatGPT Ende 2022 vorangetrieben wurden, haben eine Ära der generativen künstlichen Intelligenz eingeläutet. Fast drei Jahre später führen diese Fortschritte zu Echtzeit-Sprachübersetzern.
Für Apple ist die Live-Übersetzung ein wichtiges Verkaufsargument für die AirPods Pro 3, die das Unternehmen am Dienstag vorstellte. Die neuen Ohrhörer für 250 US-Dollar kommen nächste Woche in den Handel. Dank der Live-Übersetzung können Nutzer sofort Französisch, Deutsch, Portugiesisch und Spanisch ins Englische übersetzt hören. Die Live-Übersetzung wird am Montag auch als Update für die AirPods 4 und AirPods Pro 2 verfügbar sein.
Und wenn zwei Personen über AirPods miteinander sprechen, kann das Gespräch in den Kopfhörern jedes Benutzers gleichzeitig in beide Richtungen übersetzt werden. In Apples Videodemo sah es so aus, als würden zwei Personen in verschiedenen Sprachen miteinander sprechen.
Analysten sind begeistert, dass die Funktion einen Fortschritt für Apples KI-Strategie darstellen könnte. Die Übersetzungsfunktion muss mit einem ausreichend neuen iPhone gekoppelt werden, um Apple Intelligence, Apples KI-Software-Suite, auszuführen.
„Wenn wir die AirPods tatsächlich für Live-Übersetzungen nutzen können, ist das eine Funktion, die die Leute tatsächlich zum Upgrade bewegen würde“, sagte DA Davidson-Analyst Gil Luria am Mittwoch gegenüber CNBC.
Übersetzungen entwickeln sich zu einem zentralen Schlachtfeld in der Technologiebranche, da die KI so gut wird, dass sie Sprachen so schnell übersetzen kann, wie Menschen sprechen.
Aber Apple ist nicht allein.
Im vergangenen Jahr haben Google und Meta auch Hardwareprodukte mit Echtzeit-Übersetzungsfunktionen herausgebracht.
Das Pixel 10 von Google verfügt über eine Funktion, die bei Telefongesprächen das Gesagte in die Sprache des Zuhörers übersetzen kann. Diese Funktion namens „Voice Translate“ soll auch die Stimmmodulation des Sprechers bewahren. „Voice Translate“ wird ab Montag per Software-Update auf den Smartphones verfügbar sein.
Bei Googles Live-Demo im August konnte Voice Translate einen Satz des Entertainers Jimmy Fallon ins Spanische übersetzen, und dieser klang tatsächlich wie der Komiker. Apples Funktion versucht nicht, die Stimme des Nutzers zu imitieren.
Unterdessen gab Meta im Mai bekannt, dass seine Ray-Ban Meta-Brille in der Lage sein werde, das Gesagte einer Person in einer anderen Sprache über die Lautsprecher des Geräts zu übersetzen, und dass die anderen Gesprächspartner die übersetzten Antworten auf dem Telefon des Benutzers transkribiert sehen könnten.
Meta wird am Mittwoch eine eigene Produkt-Keynote halten, in der das Unternehmen voraussichtlich die nächste Generation seiner Smart Glasses vorstellen wird, die über ein kleines Display in einer der Linsen verfügen werden, berichtete CNBC im August. Es ist unklar, ob Meta weitere Übersetzungsfunktionen ankündigen wird.
Und OpenAI präsentierte im Juni einen intelligenten Sprachassistentenmodus für ChatGPT , der unter anderem über eine integrierte flüssige Übersetzung verfügt. ChatGPT ist in Apples Siri integriert, allerdings nicht im Sprachmodus. OpenAI plant in den kommenden Jahren die Veröffentlichung neuer Hardwareprodukte mit Apples ehemaligem Design-Guru Jony Ive.
Der Aufstieg der Live-Übersetzung könnte auch ganze Branchen umgestalten. Übersetzer und Dolmetscher sind der am stärksten von KI bedrohte Berufszweig, und 98 % der Arbeitstätigkeiten von Übersetzern überschneiden sich mit den Möglichkeiten der KI, wie eine im August veröffentlichte Studie von Microsoft Research ergab .
In den letzten Jahren sind eine Reihe speziell entwickelter Übersetzungsgeräte auf den Markt gekommen. Sie nutzen die Vorteile des weltweiten Hochgeschwindigkeits-Mobilfunks und verbessern Online-Übersetzungsdienste, um puckähnliche Geräte oder Kopfhörer mit integrierter Übersetzung für ein paar hundert Dollar anzubieten.
„Was mir an Apples Vorgehen gefällt, ist, dass es die Dringlichkeit dieses Problems deutlich macht“, sagt Joe Miller, US-Geschäftsführer des japanischen Unternehmens Pocketalk. Pocketalk stellt für 299 Dollar ein Übersetzungsgerät her, das zwischen zwei Menschen vermittelt, die sich in unterschiedlichen Sprachen unterhalten, und das Gespräch in Audio und Text übersetzt.
Angesichts der enormen Größe von Apple und der Tatsache, dass Apple laut Canalys allein im ersten Quartal rund 18 Millionen kabellose Kopfhörer ausgeliefert hat, wird der Markteintritt des Unternehmens einem größeren Kundenkreis die Verbesserungen der Übersetzungstechnologie der letzten Jahre zugänglich machen.
Trotz Apples Markteintritt behaupten die Hersteller spezieller Geräte, dass ihr Fokus auf Genauigkeit und linguistisches Wissen zu besseren Übersetzungen führen werde als die kostenlosen Übersetzungen eines neuen Telefons.
„Wir haben tatsächlich Linguisten eingestellt“, sagte Aleksander Alski, Leiter der USA und Kanada des polnischen Unternehmens Vasco Electronics. Das Unternehmen bringt Übersetzungskopfhörer auf den Markt, die die Stimme des Benutzers imitieren können, ähnlich wie die Funktion von Google. „Wir haben die KI mit menschlicher Eingabe kombiniert und konnten so eine viel höhere Genauigkeit in allen von uns angebotenen Sprachen erreichen.“
Hinzu kommt der Heimvorteil. Der größte Markt von Vasco Electronics ist Europa, und Apples Live-Übersetzung ist für EU-Nutzer nicht verfügbar, heißt es auf der Apple-Website.
Einige der von Technologieunternehmen eingeführten Produkte sind nicht universell einsetzbar und derzeit auf eine kleine Anzahl von Sprachen beschränkt. Apples Funktion ist nur in fünf Sprachen verfügbar, Pocketalks in 95.
Miller von Pocketalk glaubt, dass das Potenzial der Technologie weit über die Weinbestellung eines Touristen in Frankreich hinausgeht. Am wirkungsvollsten sei sie, wenn sie an Arbeitsplätzen wie Schulen und Krankenhäusern zum Einsatz käme, wo Datenschutz- und Sicherheitsfunktionen erforderlich seien, die über das hinausgingen, was Apple und Google bieten.
„Hier geht es nicht um Luxustourismus und Reisen“, sagte Miller. „Hier geht es um die Schnittstelle zwischen Sprache und Reibung, und darum, wann eine Diskussion geführt werden muss.“
Apple hat auf eine Bitte um Stellungnahme nicht geantwortet.
CNBC