Traducción en directo de Microsoft Teams: cómo funciona y dónde se queda corta
Si ha buscado "traducción en directo de Microsoft Teams", la respuesta corta y honesta es: sí, Teams puede traducir una reunión en directo —de tres formas distintas— y cuál de ellas obtendrá depende de la licencia que tenga el organizador y del tipo de reunión que haya programado. Microsoft ha desplegado más maquinaria de traducción en directo que cualquier otro proveedor de conferencias, incluido un intérprete con IA genuinamente ambicioso. También ha vallado cada pieza de forma distinta, y es en esas vallas donde se toman realmente las decisiones de compra. Este artículo explica cómo funciona cada una, cómo activarlas y exactamente dónde está el techo.
Este es el complemento práctico de plataforma a nuestra guía fundamental, Traducción de reuniones en tiempo real: cómo funciona y cómo evaluarla. Para las versiones de Google Meet y Zoom de este artículo, consulte Meet y Zoom.
Las tres funciones, y por qué no son lo mismo
1. Subtítulos traducidos en directo (texto)
La función consolidada. Teams transcribe la reunión en directo y traduce el flujo de subtítulos al idioma elegido por cada participante: cada asistente elige su propio idioma de subtítulos de forma independiente. La página de soporte de Microsoft enumera 31 idiomas de traducción para reuniones (su propia página de licencias menciona 40, y la página de town halls dice "más de 50"; preferimos citar la lista de 31 idiomas que realmente detalla). Funciona en reuniones, webinars y town halls, aunque en town halls el organizador preselecciona un conjunto de seis idiomas, diez con Premium.
La barrera: el organizador necesita una licencia Teams Premium o Microsoft 365 Copilot para que los asistentes obtengan subtítulos traducidos. Los subtítulos en inglés sencillo son gratuitos; la traducción es la capa de pago. Y los subtítulos no se guardan: cuando la reunión termina, la traducción se evapora.
2. Agente Interpreter (audio, IA)
El protagonista de Ignite 2024, ahora disponible de forma general: un agente de IA que traduce audio hablado a audio hablado, por participante; usted elige el idioma en el que quiere escuchar, e Interpreter incluso puede simular la propia voz del orador en la traducción. Las llamadas lo recibieron en enero de 2026; un modo consecutivo por turnos para reuniones bilingües se lanzó en mayo de 2026. De las tres grandes plataformas, esta es arquitectónicamente lo más cercano a una interpretación simultánea por oyente.
Y por eso precisamente importan sus vallas: están en la sección de límites, y son decisivas.
3. Interpretación de idiomas (humana, por canales)
La clásica: el organizador preconfigura hasta 16 pares de idiomas e invita a intérpretes humanos —personas que usted contrata, briefa y paga— a los que se asigna un canal de audio a cada uno. Los asistentes eligen un canal y ajustan el volumen entre el original y el intérprete con un control deslizante. No se documenta licencia premium, pero la carga de producción es suya, y las restricciones son reales: hay que configurarla antes de iniciar la reunión, los intérpretes deben unirse desde la aplicación de escritorio, no hay soporte web, ni salas para grupos reducidos, ni reuniones con cifrado de extremo a extremo.
Cómo activar cada una
Subtítulos traducidos: el organizador tiene Premium o Copilot → cualquier asistente activa los subtítulos en directo, abre la configuración de subtítulos y elige un idioma en Traducir a.
Agente Interpreter: usted (el oyente) necesita una licencia Microsoft 365 Copilot. En una reunión programada, active Interpreter para usted, elija el idioma en Escuchar la reunión en y, opcionalmente, permita que simule las voces (su administrador controla si esto está activado de forma predeterminada).
Interpretación de idiomas: el organizador la habilita al programar, asigna intérpretes por par de idiomas, y los asistentes eligen su canal una vez iniciada la reunión. No se puede añadir a una reunión que ya esté en curso.
La fricción no está en los interruptores. Está en lo que esos interruptores pueden y no pueden hacer.
Los límites que realmente deciden si encaja
A mediados de 2026, según la propia documentación de Microsoft:
- El agente Interpreter habla 10 idiomas: inglés, español, portugués, japonés, mandarín, italiano, alemán, francés, coreano y (desde abril de 2026) chino tradicional. Por debajo, pivota a través del inglés en formato texto: el habla se reconoce, se convierte a inglés, se traduce y luego se sintetiza. Cada par sin inglés paga el peaje del relevo.
- Está medido y licenciado por usuario. Interpreter viene con una licencia Microsoft 365 Copilot e incluye 20 horas por usuario al mes; más allá de eso, el acceso queda "sujeto a la capacidad disponible". Reuniones multilingües como una utilidad medida.
- Omite precisamente las reuniones donde más lo querría. Sin reuniones ad hoc/instantáneas, sin webinars, sin town halls, sin Teams Free, sin Teams Rooms en Android. Los grandes formatos de difusión multilingüe se quedan solo con subtítulos traducidos.
- Nada sobrevive a la reunión. Las grabaciones capturan solo el audio original, sin pista de interpretación. Las transcripciones traducidas existen únicamente en directo; después, solo queda el original en el idioma hablado. Los subtítulos traducidos tampoco se guardan.
- Advertencia de calidad del propio Microsoft: Interpreter "no está optimizado para intercambios rápidos ni diálogos solapados", es decir, para cómo suenan realmente las reuniones de trabajo. No se publica ninguna cifra de latencia.
- La interpretación humana es una producción. Solo preconfigurada, intérpretes solo en escritorio, sin asistentes web, sin salas para grupos reducidos, sin E2EE; y los intérpretes facturan por día, por idioma, una estructura de costes propia.
Nada de esto hace que el stack de Teams sea malo; es el más completo de las grandes plataformas. Pero lo convierte en un intérprete licenciado por asiento, en 10 idiomas, 20 horas al mes, para reuniones internas programadas, con subtítulos para todo lo demás.
El techo estructural, en una frase
Teams interpretará una reunión programada para los colegas cuyos asientos tengan licencia Copilot, en 10 idiomas, a través de un relevo en inglés, 20 horas al mes, y sin dejar ningún registro traducido. Una organización genuinamente multilingüe necesita que la reunión sea multilingüe: para todos los que participan, incluido el público del webinar, el invitado sin su licencia y la grabación que conserva.
Si sus reuniones multilingües son internas, programadas y están dentro de esos 10 idiomas, y su organización ya paga por Copilot, Interpreter es una respuesta real, integrada en una herramienta que ya tiene. Si sus reuniones incluyen webinars, externos, pares de idiomas que no deberían pasar por el inglés, o cualquier cosa de la que necesite dejar constancia, ha llegado al techo.
Cuando se le queda corta la matriz de licencias
Este es el trabajo para el que construimos InterMIND: la reunión en sí transcurre en el idioma de cada participante: sin licencia por oyente, sin contador, sin relevo en inglés. En concreto, donde Teams pone barreras y contadores:
- 21 idiomas en directo en voz, chat y notas compartidas, traducidos directamente entre pares: una reunión francés↔japonés nunca pasa por el inglés. (El stack completo de extremo a extremo tiene su propia página.)
- Todos los presentes en la reunión lo obtienen. La traducción es cómo funciona la plataforma, no una prestación por asiento: invitados y externos incluidos, sin contador de 20 horas.
- Webinars, town halls y conferencias incluidos: hasta 1.500 participantes, cada uno eligiendo su propio idioma de escucha: interpretación simultánea sin la cabina.
- El registro sobrevive. Transcripción multilingüe, grabación y documentos traducidos empaquetados tras la reunión, no subtítulos que se evaporan.
- Calidad auditable. Puntuaciones por par de idiomas sobre tráfico real, publicadas mensualmente en
/benchmark: no afirmadas, medidas.
No estamos diciendo que Teams sea malo; Interpreter es la función de traducción más seria que ha lanzado ningún incumbente. Lo que decimos es que las vallas a su alrededor describen una reunión distinta de la que los equipos multilingües realmente celebran. La versión función por función está en InterMIND vs. Microsoft Teams.
Pruebe el otro lado del techo
/demo: ejecute nuestra pipeline de voz en directo sobre su propio audio, en cualquiera de los 21 idiomas, y escuche traducción por oyente sin matriz de licencias./benchmark: calidad de traducción por par y por mes sobre tráfico real, con la metodología documentada.- InterMIND vs. Microsoft Teams: honesto, función por función.
La traducción en directo de Teams es real, ambiciosa y está cuidadosamente vallada: subtítulos para muchos, un intérprete con relevo en inglés para los pocos licenciados, canales humanos para los eventos que justifican el despliegue. Saber dónde están las vallas es toda la decisión.
— The Mind.com Team
Fuentes: Microsoft — Usar subtítulos en directo en reuniones de Teams, Microsoft Learn — Transcripción y subtítulos de reuniones, Microsoft — Interpreter en reuniones y llamadas de Teams, Microsoft Learn — Agente Interpreter en Teams, Microsoft — Usar la interpretación de idiomas en reuniones de Teams, Microsoft Learn — Licencias de Teams Premium. Microsoft amplía las listas de idiomas y las licencias con el tiempo; consulte las páginas para conocer el estado actual.