Gespräche über Sprachgrenzen hinweg sollen natürlicher werden: Google führt mit „Gemini 3.5 Live Translate“ ein neues KI-Modell ein, das gesprochene Sprache in Echtzeit übersetzen und dabei mehr vom ursprünglichen Ausdruck erhalten soll.
Das Modell ist für die Google-Translate-App auf Android und iOS vorgesehen und wird weltweit eingeführt. Erste Nutzerinnen und Nutzer haben bereits Zugriff. Google positioniert Gemini 3.5 Live Translate als nächsten Schritt in einem langjährigen Ziel: Sprachbarrieren durch automatische Echtzeit-Übersetzung weiter zu reduzieren.
Laut Google erkennt das System mehr als 70 Sprachen automatisch. Die Übersetzungen sollen nicht nur den Inhalt übertragen, sondern auch Intonation, Sprechtempo und Stimmlage des Sprechers berücksichtigen. Zudem soll das Modell kontinuierlich übersetzte Sprache erzeugen können, statt erst auf das Ende eines Redebeitrags zu warten. Das könnte Gespräche flüssiger machen, weil weniger Pausen zwischen Originalsprache und Übersetzung entstehen.
Für Android ergänzt Google die Translate-App um einen neuen Hörmodus. Übersetzungen können dort entweder über Kopfhörer oder direkt über die Hörmuschel des Smartphones ausgegeben werden. Damit rückt die Funktion näher an Alltagssituationen heran, in denen Nutzerinnen und Nutzer schnell eine gesprochene Übersetzung benötigen.
Auch Google Meet soll Gemini 3.5 Live Translate erhalten. Dort wäre der Sprung deutlich: Bisher stehen in Meet nur fünf Sprachen zur Wahl, künftig sollen mehr als 70 Sprachen unterstützt werden. Google spricht von über 2000 möglichen Sprachkombinationen in einem Meeting. Bislang funktionierte die Sprachübersetzung in Meet nur vom und ins Englische.
Parallel arbeitet Google an einer überarbeiteten Bedienoberfläche in Meet, damit Nutzerinnen und Nutzer schneller auf die Sprachübersetzung zugreifen können. Die neue Version startet zunächst als private Vorschau für ausgewählte Google-Workspace-Geschäftskunden. Der Beginn ist für einen noch nicht genau festgelegten Zeitpunkt im Laufe dieses Monats geplant. Im weiteren Jahresverlauf soll die Funktion weiteren Nutzern zur Verfügung stehen.
Entwickler erhalten Zugriff auf die neue Gemini-Version als Public Preview über die Gemini Live API und Google AI Studio. Von Gemini 3.5 Live Translate erzeugtes Audio soll wie andere KI-generierte Inhalte von Google mit SynthID gekennzeichnet werden, einem digitalen Wasserzeichen.
Für international arbeitende Organisationen ist vor allem die Kombination aus mehr Sprachen, direkter Meeting-Integration und natürlicherer Sprachausgabe relevant. Entscheidend bleibt dabei, wie zuverlässig die Übersetzungen in realen Gesprächen mit unterschiedlichen Akzenten, Sprechgeschwindigkeiten und Gesprächssituationen funktionieren.
