Zoom Live-Übersetzung: Wie sie funktioniert – und wo sie aufhört
Wenn Sie nach „Zoom Live-Übersetzung" gesucht haben, lautet die ehrliche Kurzantwort: Ja, Zoom kann ein Live-Meeting übersetzen – auf drei verschiedene Arten – und welche Sie bekommen, hängt von Ihrem Plan, Ihrer Region und davon ab, ob Sie bereit sind, die Dolmetscher selbst zu engagieren. Alle drei Varianten gibt es wirklich. Keine davon ist ein Raum, in dem ein deutscher, ein japanischer und ein brasilianischer Teilnehmer das Meeting jeweils in der eigenen Sprache hören – und das über die gesamte Dauer hinweg. Dieser Beitrag erklärt, wie jede Variante funktioniert, wie Sie sie aktivieren und wo genau die Obergrenze liegt.
Dies ist die Plattform-Anleitung als Ergänzung zu unserem grundlegenden Leitfaden Echtzeit-Meeting-Übersetzung: Wie sie funktioniert und wie man sie bewertet. Für die Google-Meet- und Microsoft-Teams-Varianten dieses Beitrags siehe Meet und Teams.
Die drei Funktionen – und warum sie nicht dasselbe sind
Zoom hat Live-Übersetzung in drei unterschiedlichen Formen ausgeliefert. Sie werden ständig durcheinandergeworfen – trennen Sie sie also zuerst:
1. Übersetzte Untertitel (Text)
Das Arbeitspferd. Zooms automatisierte Untertitel transkribieren live; übersetzte Untertitel übertragen diesen Text-Stream in die gewählte Sprache jedes Teilnehmers. Zwei wirklich gute Punkte: Die Sprachliste ist lang – 36 vollständig unterstützte Sprachen, dazu Griechisch, Norwegisch und Walisisch als reine Zielsprachen – und jeder Teilnehmer wählt seine Untertitelsprache unabhängig, ohne den Host fragen zu müssen. Funktioniert in Meetings und Webinaren.
Der Haken ist die Schranke: Übersetzte Untertitel sind in den Business Plus- und Enterprise-Workplace-Plänen enthalten. Bei Pro oder Basic Business brauchen Sie das kostenpflichtige Translated Captions-Add-on – das ist die eine KI-Funktion, die Zoom nicht in das AI Companion-Paket aufgenommen hat, das mit jedem kostenpflichtigen Plan kommt.
Und es ist ein Leseerlebnis. Untertitel übersetzen, was jemand liest, nicht, was jemand hört.
2. Voice-Translator für Meetings (Audio, Beta)
Die Schlagzeile 2025–2026, angekündigt mit AI Companion 3.0 auf der Zoomtopia. Diese Variante spricht: Sie nimmt den Stream der übersetzten Untertitel und gibt ihn als synthetisches übersetztes Audio wieder, pro Teilnehmer, mit einem Schieberegler, um die Originalstimme gegen die Übersetzung auszubalancieren. Jeder Teilnehmer wählt seine eigene Sprech- und Hörsprache.
Nach Zooms eigener Dokumentation handelt es sich zugleich um eine eng eingezäunte Beta – die Details stehen im Abschnitt zu den Grenzen weiter unten, und sie sind entscheidend.
3. Language Interpretation (Menschen, Kanäle)
Die älteste Funktion und die, die Event-Teams kennen: Der Host benennt bis zu 20 menschliche Dolmetscher, Zoom öffnet pro Sprache einen Audiokanal, und die Zuhörer wählen einen Kanal – das Originalaudio läuft leise darunter. Zoom liefert hier die Infrastruktur, nicht die Dolmetscher. Die buchen, briefen und bezahlen Sie selbst. Verfügbar für Pro-, Business-, Education- und Enterprise-Konten, mit neun Standard-Kanalsprachen plus benutzerdefinierten.
So aktivieren Sie jede Variante
Übersetzte Untertitel: Ein Administrator aktiviert automatisierte und übersetzte Untertitel in den Kontoeinstellungen (Business Plus/Enterprise oder das Add-on). Im Meeting klickt jeder Teilnehmer auf die Untertitelsteuerung und wählt seine Sprache – ohne Zutun des Hosts.
Voice-Translator: Ein Administrator aktiviert ihn unter den AI Companion-Einstellungen (Pro/Business/Enterprise, US-Cluster-Konten, Desktop-App 7.0.0+). Im Meeting wählen Sie Ihre Sprechsprache und die Sprache, die Sie hören möchten, und justieren das Verhältnis zwischen Original und Übersetzung.
Language Interpretation: Der Host plant ein Meeting oder Webinar mit aktivierter Interpretation, weist Dolmetscher im Voraus zu (oder im laufenden Meeting aus der Desktop-App heraus), und die Teilnehmer wählen nach Start ihren Audiokanal.
Die Reibung liegt nicht bei den Schaltern. Sie liegt darin, was die Schalter leisten können – und was nicht.
Die Grenzen, die wirklich entscheiden, ob es passt
Stand Mitte 2026, gemäß Zooms eigener Support-Dokumentation:
- Untertitel übersetzen Text, nicht den Raum. Die lange Sprachliste und die individuelle Wahl pro Teilnehmer sind real – aber alle lesen Untertitel, während das Audio des Meetings einsprachig bleibt. Zoom weist außerdem klar darauf hin, dass „übersetzte Untertitel möglicherweise nicht exakt sind", und Dialekte werden nicht untereinander übersetzt (kein Französisch (Frankreich) ↔ Französisch (Kanada)).
- Der Voice-Translator ist eine Beta mit harten Grenzen. Fünf Sprachen – Englisch, Chinesisch, Französisch, Japanisch, Spanisch. Nur US-Cluster-Konten. Ein Nutzungskontingent von 5 Stunden pro 30 Tage (insgesamt 10 Stunden während der Beta). Nur Meetings – keine Webinare. Nur Desktop-App. Und bei langen Redebeiträgen ist es nicht mehr simultan: Längere Wortmeldungen werden erst nach der Sprechpause übersetzt – Konsekutivdolmetschen mit synthetischer Stimme. Zooms Dokumentation deutet außerdem darauf hin, dass die Funktion nach Ende der Beta kostenpflichtig wird.
- Language Interpretation braucht Ihre Menschen und Ihre Planung. Nur geplante Meetings – keine Personal Meeting ID, keine Spontan-Meetings, keine Breakout-Räume – und die Dolmetscher sind Profis, die Sie selbst suchen, buchen und tageweise pro Sprache bezahlen. Das ist kein Mangel, sondern eine andere Produktkategorie mit einer eigenen Kostenstruktur.
- In Webinaren gar keine maschinelle Sprachübersetzung. Ein mehrsprachiges Webinar bedeutet bei Zoom heute übersetzte Untertitel zum Lesen oder menschliche Dolmetscherkanäle, die Sie selbst besetzen.
Nichts davon macht Zooms Funktionen schlecht. Insbesondere der Untertitel-Stack ist breit aufgestellt und tatsächlich pro Teilnehmer wählbar. Aber er macht Zooms Live-Übersetzung textorientiert, wobei gesprochene Übersetzung entweder in einer Beta mit fünf Sprachen und Kontingent oder durch Personen erfolgt, die Sie selbst engagieren.
Die strukturelle Obergrenze in einem Satz
Zoom übersetzt, was Ihr Meeting liest – breit aufgestellt und gut. Was Ihr Meeting hört, ist entweder eine Beta mit 5 Sprachen, 5 Stunden pro Monat und nur US, oder menschliche Dolmetscher, die Sie selbst mitbringen. Ein wirklich mehrsprachiges Meeting braucht jeden Teilnehmer, der den Raum in der eigenen Sprache hört, über das gesamte Meeting hinweg, von überall – und das ist eine Architekturfrage, kein Kontingent-Upgrade.
Wenn Ihre Meetings untertitelfreundlich sind – Präsentationen, Webinare, bei denen die Teilnehmer mitlesen – könnten Zooms übersetzte Untertitel im Business Plus-Plan alles sein, was Sie brauchen, in einem Tool, das Sie ohnehin haben. Wenn Ihre Meetings Gespräche sind – Menschen, die sich ins Wort fallen, entscheiden, in drei Sprachen laut nachdenken –, sind Sie an der Obergrenze.
Wenn Untertitel und Kontingente nicht mehr reichen
Genau dafür haben wir InterMIND gebaut: nicht Untertitel unter einem einsprachigen Call, sondern jeder Teilnehmer hört das Meeting in der eigenen Sprache, simultan, live. Konkret – dort, wo Zooms Stack liest und seine Beta fünf Sprachen für fünf Stunden pro Monat spricht:
- 21 Sprachen live auf Stimme, Chat und gemeinsamen Notizen – jede Kombination, kein englischer Anker, keine regionale Schranke, kein Monatskontingent. (Der vollständige End-to-End-Übersetzungs-Stack hat eine eigene Seite.)
- Audio pro Zuhörer, im Sekundenbruchteil. Jeder Teilnehmer hört das Meeting gleichzeitig in der selbst gewählten Sprache – fünf Personen, fünf Sprachen, ein Raum. (Wie das unter der Haube funktioniert: Ein Blick in die vier Übersetzungspipelines.)
- Webinare und Konferenzen inklusive – bis zu 1.500 Teilnehmer, jeder wählt seine eigene Hörsprache. Das ist Simultandolmetschen ohne Kabine, kein Add-on.
- Dokumente ebenfalls – legen Sie ein PDF oder DOCX ins Meeting, und jeder sieht es in seiner Sprache, 30 Sprachen für Dateien.
- Qualität, die Sie nachprüfen können. Wir veröffentlichen Werte pro Sprachpaar auf echtem Traffic unter
/benchmark– Zooms Genauigkeitsaussagen stehen in eigenen Pressemitteilungen; unsere sind reproduzierbar.
Wir behaupten nicht, Zoom sei schlecht – für untertitelorientierte Meetings ist sein Übersetzungs-Stack einer der breitesten am Markt. Wir behaupten, es ist eine andere Art von Meeting. Die Variante Funktion für Funktion gibt es unter InterMIND vs. Zoom.
Die andere Seite der Obergrenze ausprobieren
/demo– betreiben Sie unsere Live-Voice-Pipeline mit Ihrem eigenen Audio, in einer von 21 Sprachen, und hören Sie Übersetzung pro Zuhörer, statt sie zu lesen./benchmark– Übersetzungsqualität pro Paar und pro Monat auf echtem Traffic, mit dokumentierter Methodik.- InterMIND vs. Zoom – ehrlich, Funktion für Funktion.
Zooms Live-Übersetzung ist real, nützlich und klar eingezäunt: Untertitel für die meisten, eine Beta mit fünf Sprachen für einige, menschliche Dolmetscher für den Rest. Zu wissen, wo die Zäune verlaufen, ist die ganze Entscheidung.
— The Mind.com Team
Quellen: Zoom — Enabling and configuring translated captions, Zoom — Viewing captions in another language, Zoom — Using the Voice translator for meetings, Zoom — Enabling or disabling Voice translator for meetings, Zoom — Using Language Interpretation in your meeting or webinar, Zoom — Enabling Language Interpretation, Zoomtopia 2025 announcements. Zoom erweitert Pläne und Sprachlisten im Lauf der Zeit; den aktuellen Stand finden Sie auf den Support-Seiten.