Zoom 实时翻译:工作原理及其边界
如果您搜索了"Zoom 实时翻译",诚实的简短回答是:**是的,Zoom 可以翻译实时会议——通过三种不同的方式——具体取决于您的套餐、所在地区,以及您是否愿意自行聘请口译员。**这三种方式都真实存在。但没有一种能让一位德国人、一位日本人和一位巴西人在整场会议中各自听到自己语言的内容。本文将解释每种方式的工作原理、如何启用,以及边界究竟在哪里。
本文是我们基础指南实时会议翻译:工作原理及评估方法的平台操作指南配套篇。Google Meet 和 Microsoft Teams 版本请参见 Meet 和 Teams。
三种功能,以及它们为何不是一回事
Zoom 已推出三种截然不同的实时翻译形式。它们经常被混为一谈,因此先把它们区分开:
1. 翻译字幕(文本)
主力功能。Zoom 的自动字幕进行实时转录;翻译字幕则将该文本流翻译为每位参与者所选的语言。这里有两个确实出色的优点:语言列表很长——36 种完全支持的语言,外加希腊语、挪威语和威尔士语作为仅目标语言——而且每位参与者各自独立选择自己的字幕语言,无需征得主持人同意。它在会议和网络研讨会中均可使用。
问题在于门槛:翻译字幕仅随 Business Plus 和 Enterprise Workplace 套餐提供。在 Pro 或基础 Business 套餐上,您需要付费的 Translated Captions 附加包——这是 Zoom 没有纳入随每个付费套餐附带的 AI Companion 套件的唯一一个 AI 功能。
而且这是一种阅读体验。字幕翻译的是任何人读到的内容,而非任何人听到的内容。
2. 会议语音翻译器(音频,测试版)
2025–2026 年的头条功能,在 Zoomtopia 大会上与 AI Companion 3.0 一同发布。这一功能会说话:它将翻译字幕流渲染为合成翻译音频,按参与者各自生成,并配有滑块以平衡原声与译音。每位参与者各自选择自己的说话和收听语言。
按 Zoom 自己的文档,这也是一个边界极为严格的测试版——具体细节在下方的限制部分,而且它们具有决定性意义。
3. 语言口译(人工,频道)
最早的功能,也是活动团队熟知的功能:主持人最多可指定 20 位人工口译员,Zoom 为每种语言开一个音频频道,听众选择一个频道——原声以低音量在背景中保留。Zoom 在这里提供的是通道设施,而非口译员。您需自行预订、做简报并支付费用。它在 Pro、Business、Education 和 Enterprise 账户上可用,默认有九种频道语言,可另行自定义。
如何启用每一项功能
**翻译字幕:**管理员在账户设置中启用自动字幕和翻译字幕(Business Plus/Enterprise 或附加包)。在会议中,每位参与者点击字幕控制并选择自己的语言——无需主持人介入。
**语音翻译器:**管理员在 AI Companion 设置下启用(Pro/Business/Enterprise、美国集群账户、桌面应用 7.0.0+)。在会议中,您选择您的说话语言和您希望听到的语言,并调整原声/译音的音量平衡。
**语言口译:**主持人安排启用口译的会议或网络研讨会,提前(或在会议中通过桌面应用)指定口译员,参与者在会议开始后选择自己的音频频道。
阻力不在于开关本身。而在于这些开关能做什么、不能做什么。
真正决定是否合适的限制
截至 2026 年年中,据 Zoom 自身支持文档:
- **字幕翻译的是文本,不是会议室。**长语言列表和按参与者独立选择是真实的——但每个人都在阅读字幕,而会议的音频仍是单语。Zoom 也明确指出"翻译字幕可能不准确",而且方言之间不互译(没有 French (France) ↔ French (Canada))。
- **语音翻译器是一个有硬性边界的测试版。**五种语言——英语、中文、法语、日语、西班牙语。仅限美国集群账户。使用配额为每 30 天 5 小时(测试期内合计 10 小时)。仅限会议——不支持网络研讨会。仅限桌面应用。在长段发言时,它就不再是同声的:较长的发言会在发言者停顿后再翻译——即用合成语音进行的交替传译。Zoom 文档还预计该功能在测试结束后将需付费购买。
- **语言口译需要您自己的人员和规划。**仅限已安排的会议——不支持个人会议 ID、即时会议、分组讨论室——而且口译员是您自行寻找、预订并按天、按语言支付的专业人员。这不是缺陷;它是另一个产品类别,拥有自己的成本结构。
- **网络研讨会中完全没有机器语音翻译。**今天在 Zoom 上的多语言网络研讨会意味着为读者提供翻译字幕,或者由您自行配备的人工口译员频道。
这些都不意味着 Zoom 的功能不好。字幕栈尤其覆盖广泛且确实是按参与者独立的。但这使得 Zoom 的实时翻译以文本为先,而口语翻译要么是一个五种语言、有配额限制的测试版,要么由您聘请的人员提供。
结构性上限,一句话总结
**Zoom 翻译您的会议读到的内容——广泛而出色。而您的会议听到的,要么是一个 5 种语言、每月 5 小时、仅限美国的测试版,要么是您自行带来的人工口译员。**真正的多语言会议需要每位参与者在整场会议中、无论身在何处都听到自己语言的会议室对话——这是架构问题,而非配额提升问题。
如果您的会议适合字幕——演示、与会者跟读的网络研讨会——那么 Business Plus 套餐上的 Zoom 翻译字幕可能就是您所需的全部,而且它就在您已有的工具中。如果您的会议是对话——人们打断、决策、用三种语言出声思考——那您就已经触到了上限。
当您已超越字幕和配额时
这正是我们打造 InterMIND 的目标:不是单语通话下方的字幕,而是**每位参与者实时同步地以自己的语言听到会议。**具体而言,当 Zoom 的栈是阅读,其测试版每月支持五种语言、五小时口语时:
- 21 种语言实时语音支持,涵盖聊天和共享笔记——任意组合,无英语锚点,无地区门槛,无月度配额。(完整的端到端翻译栈在专门的页面上介绍。)
- **按听众独立的音频,亚秒级延迟。**每位参与者同时以各自选定的语言听到会议——五个人,五种语言,一个房间。(底层工作原理:深入四种翻译流水线。)
- 包含网络研讨会和大会——最多 1,500 名参与者,每人选择自己的收听语言。这是无需口译间的同声传译,而不是附加功能。
- 文档也支持——将 PDF 或 DOCX 拖入会议,每位查看者都能看到自己语言的版本,文件支持 30 种语言。
- **可审计的质量。**我们在
/benchmark上发布基于真实流量的各语言对评分——Zoom 的准确性主张出自其自己的新闻稿;我们的主张是可复现的。
我们并不主张 Zoom 不好——对于以字幕为先的会议,其翻译栈是已上线产品中最广泛的之一。我们只是说,它是另一种形态的会议。逐项功能的对比可在 InterMIND vs. Zoom 查看。
试试上限的另一侧
/demo—— 在您自己的音频上运行我们的实时语音流水线,支持 21 种语言中的任意一种,并听到按听众独立的翻译,而非阅读它。/benchmark—— 基于真实流量的逐对、逐月翻译质量,方法论已书面公开。- InterMIND vs. Zoom —— 诚实、逐项功能对比。
Zoom 实时翻译是真实存在、有用且边界清晰的:大多数人用字幕,部分人用五种语言的测试版,其余人用人工口译员。了解边界在哪里,就是整个决策的全部。
—— The Mind.com Team
资料来源:Zoom — Enabling and configuring translated captions、Zoom — Viewing captions in another language、Zoom — Using the Voice translator for meetings、Zoom — Enabling or disabling Voice translator for meetings、Zoom — Using Language Interpretation in your meeting or webinar、Zoom — Enabling Language Interpretation、Zoomtopia 2025 announcements。Zoom 会随时间扩展套餐和语言列表;请查阅支持页面以获取最新状态。