Traduction en direct sur Zoom : comment ça marche, et où ça s'arrête
Si vous avez cherché « traduction en direct Zoom », la réponse courte et honnête est : oui, Zoom peut traduire une réunion en direct — de trois façons différentes — et celle dont vous disposez dépend de votre forfait, de votre région, et de votre disposition à recruter vous-même les interprètes. Les trois existent réellement. Aucune ne constitue une salle où un participant allemand, un japonais et un brésilien entendent chacun la réunion dans sa propre langue pendant toute sa durée. Cet article explique comment chacune fonctionne, comment l'activer, et précisément où se situe le plafond.
Ceci est le pendant « plateforme » de notre guide fondamental, Traduction de réunion en temps réel : comment ça marche, et comment l'évaluer. Pour les versions Google Meet et Microsoft Teams de cet article, voir Meet et Teams.
Les trois fonctionnalités, et pourquoi ce n'est pas la même chose
Zoom a livré la traduction en direct sous trois formes distinctes. On les confond constamment, alors commençons par les séparer :
1. Sous-titres traduits (texte)
La fonctionnalité de fond. Les sous-titres automatiques de Zoom effectuent une transcription en direct ; les sous-titres traduits traduisent ce flux de texte dans la langue choisie par chaque participant. Deux vrais points forts ici : la liste de langues est longue — 36 langues entièrement prises en charge, plus le grec, le norvégien et le gallois en cible uniquement — et chaque participant choisit sa propre langue de sous-titres indépendamment, sans demander à l'hôte. Cela fonctionne dans les réunions et dans les webinaires.
Le hic, c'est la barrière d'accès : les sous-titres traduits sont inclus dans les forfaits Workplace Business Plus et Enterprise. Sur Pro ou Business de base, vous avez besoin de l'option payante Translated Captions add-on — c'est la seule fonctionnalité d'IA que Zoom n'a pas intégrée au bundle AI Companion livré avec chaque forfait payant.
Et c'est une expérience de lecture. Les sous-titres traduisent ce que chacun lit, pas ce que chacun entend.
2. Traducteur vocal pour les réunions (audio, bêta)
La fonctionnalité phare 2025-2026, annoncée avec AI Companion 3.0 lors de Zoomtopia. Celle-ci parle : elle reprend le flux de sous-titres traduits et le restitue en audio traduit synthétique, par participant, avec un curseur pour équilibrer la voix d'origine et la voix traduite. Chaque participant choisit sa langue d'expression et d'écoute.
C'est aussi, selon la documentation de Zoom elle-même, une bêta strictement encadrée — les détails figurent dans la section limites ci-dessous, et ils sont déterminants.
3. Interprétation linguistique (humains, canaux)
La fonctionnalité la plus ancienne, et celle que connaissent les équipes événementielles : l'hôte désigne jusqu'à 20 interprètes humains, Zoom ouvre un canal audio par langue, et les auditeurs choisissent un canal — l'audio d'origine en sourdine en dessous. Zoom fournit la tuyauterie ici, pas les interprètes. Vous les recrutez, les briefez et les payez vous-même. C'est disponible sur les comptes Pro, Business, Education et Enterprise, avec neuf langues de canal par défaut plus des langues personnalisées.
Comment activer chacune d'elles
Sous-titres traduits : un administrateur active les sous-titres automatiques et les sous-titres traduits dans les paramètres du compte (Business Plus/Enterprise ou avec l'add-on). Dans la réunion, chaque participant clique sur le contrôle des sous-titres et choisit sa langue — aucune intervention de l'hôte n'est requise.
Traducteur vocal : un administrateur l'active dans les paramètres AI Companion (Pro/Business/Enterprise, comptes du cluster US, application desktop 7.0.0+). Dans la réunion, vous choisissez votre langue d'expression et la langue que vous souhaitez entendre, puis vous ajustez l'équilibre entre l'audio original et l'audio traduit.
Interprétation linguistique : l'hôte planifie une réunion ou un webinaire avec l'interprétation activée, attribue les interprètes à l'avance (ou en cours de réunion depuis l'application desktop), et les participants choisissent leur canal audio une fois la session lancée.
La friction n'est pas dans les boutons. Elle est dans ce que ces boutons peuvent et ne peuvent pas faire.
Les limites qui décident vraiment si ça vous convient
À la mi-2026, selon la documentation de support officielle de Zoom :
- Les sous-titres traduisent du texte, pas la salle. La longue liste de langues et le choix par participant sont réels — mais tout le monde lit des sous-titres pendant que l'audio de la réunion reste monolingue. Zoom indique aussi clairement que « les sous-titres traduits peuvent ne pas être exacts », et que les dialectes ne se traduisent pas entre eux (pas de français (France) ↔ français (Canada)).
- Le traducteur vocal est une bêta avec des barrières strictes. Cinq langues — anglais, chinois, français, japonais, espagnol. Comptes du cluster US uniquement. Un quota d'usage de 5 heures par 30 jours (10 heures au total pendant la bêta). Réunions uniquement — pas de webinaires. Application desktop uniquement. Et sur les longues prises de parole, ça cesse d'être simultané : les tours étendus sont traduits après que l'orateur a marqué une pause — interprétation consécutive avec une voix synthétique. La documentation de Zoom prévoit également qu'elle deviendra payante à la fin de la bêta.
- L'interprétation linguistique exige vos humains et votre planification. Réunions planifiées uniquement — pas de Personal Meeting ID, pas de réunions instantanées, pas de salles de sous-commission — et les interprètes sont des professionnels que vous sourcez, recrutez et payez à la journée, par langue. Ce n'est pas un défaut ; c'est une catégorie de produit différente, avec une structure de coût qui lui est propre.
- Aucune traduction vocale automatique dans les webinaires. Un webinaire multilingue sur Zoom aujourd'hui, c'est soit des sous-titres traduits pour les lecteurs, soit des canaux d'interprètes humains que vous staffez vous-même.
Rien de tout cela ne rend les fonctionnalités de Zoom mauvaises. La pile de sous-titres en particulier est large et véritablement par participant. Mais cela rend la traduction en direct de Zoom orientée texte d'abord, avec une traduction parlée soit dans une bêta à cinq langues avec quota, soit assurée par des personnes que vous recrutez.
Le plafond structurel, en une phrase
Zoom traduit ce que votre réunion lit — largement et bien. Ce que votre réunion entend est soit une bêta à 5 langues, 5 heures par mois, réservée aux États-Unis, soit des interprètes humains que vous amenez vous-même. Une réunion véritablement multilingue exige que chaque participant entende la salle dans sa propre langue, pendant toute la réunion, où qu'il soit — et c'est une architecture, pas une augmentation de quota.
Si vos réunions se prêtent aux sous-titres — présentations, webinaires où les participants suivent en lisant — les sous-titres traduits de Zoom sur un forfait Business Plus suffiront peut-être, dans un outil que vous avez déjà. Si vos réunions sont des conversations — des gens qui s'interrompent, qui décident, qui pensent à voix haute en trois langues — vous avez atteint le plafond.
Quand vous avez dépassé les sous-titres et les quotas
C'est précisément le travail pour lequel nous avons construit InterMIND : non pas des sous-titres sous un appel monolingue, mais chaque participant entendant la réunion dans sa propre langue, en simultané, en direct. Concrètement, là où la pile de Zoom lit et où sa bêta parle cinq langues pendant cinq heures par mois :
- 21 langues en direct sur la voix, le chat et les notes partagées — n'importe quelle combinaison, sans ancrage à l'anglais, sans barrière régionale, sans quota mensuel. (La pile de traduction complète, de bout en bout fait l'objet de sa propre page.)
- Audio par auditeur, infraseconde. Chaque participant entend la réunion dans la langue qu'il a choisie en même temps — cinq personnes, cinq langues, une seule salle. (Le fonctionnement sous le capot : Dans les quatre pipelines de traduction.)
- Webinaires et conférences inclus — jusqu'à 1 500 participants, chacun choisissant sa propre langue d'écoute. C'est l'interprétation simultanée sans la cabine, pas une option.
- Documents aussi — déposez un PDF ou un DOCX dans la réunion et chaque lecteur le reçoit dans sa langue, 30 langues sur les fichiers.
- Une qualité que vous pouvez auditer. Nous publions les scores par paire de langues sur du trafic réel sur
/benchmark— les revendications d'exactitude de Zoom sont faites dans ses propres communiqués ; les nôtres sont reproductibles.
Nous ne prétendons pas que Zoom est mauvais — pour les réunions « sous-titres d'abord », sa pile de traduction est l'une des plus larges du marché. Nous affirmons qu'il s'agit d'une forme de réunion différente. La version fonctionnalité par fonctionnalité se trouve sur InterMIND vs. Zoom.
Essayez l'autre côté du plafond
/demo— faites tourner notre pipeline vocal en direct sur votre propre audio, dans n'importe laquelle de nos 21 langues, et entendez la traduction par auditeur au lieu de la lire./benchmark— qualité de traduction par paire et par mois sur du trafic réel, avec la méthodologie écrite noir sur blanc.- InterMIND vs. Zoom — honnête, fonctionnalité par fonctionnalité.
La traduction en direct de Zoom est réelle, utile, et clairement délimitée : des sous-titres pour la plupart, une bêta à cinq langues pour certains, des interprètes humains pour le reste. Savoir où se trouvent les barrières, c'est toute la décision.
— The Mind.com Team
Sources : Zoom — Enabling and configuring translated captions, Zoom — Viewing captions in another language, Zoom — Using the Voice translator for meetings, Zoom — Enabling or disabling Voice translator for meetings, Zoom — Using Language Interpretation in your meeting or webinar, Zoom — Enabling Language Interpretation, Zoomtopia 2025 announcements. Zoom élargit ses forfaits et ses listes de langues au fil du temps ; consultez les pages de support pour l'état actuel.