方法论

“你们支持多少种语言?”——为什么我们的诚实答案是六个数字,而不是一个

每个供应商都会给出一个语言数量。我们无法这样做,因为翻译并非单一产品。以下是 InterMIND 各界面的细分——哪些被筛选、原因以及我们在网站上发布的内容。

The Mind.com Team

“你们支持多少种语言?”——为什么我们的诚实答案是六个数字,而不是一个

“你们支持多少种语言?”——为什么我们的诚实答案是六个数字,而不是一个

这是每次采购电话会议和每次演示中的第一个问题。我们每周都会被问到三次:

“InterMIND 支持多少种语言?”

诚实的答案是:这取决于您指的是哪个界面。 我们有六个界面,它们由于充分的理由而拥有不同的语言列表。本页面提供了明确的答案,以便我们不再给出不一致的答复。


简要版本

界面语言
平台 API (createParticipant 接受)24
会议中的实时语音翻译21
实时聊天消息翻译21
实时共享笔记翻译21
聊天中的按需文件翻译 (DeepL 文档 API)30
网站 UI (在 intermind.com 本地化)6

产品支持 21 种语言。 文件:30。网站:6。API 引擎:24

语音、聊天和笔记共用相同的 21 种语言。文件支持范围更广是因为文件处理流程可以支持更多语言。网站支持范围较窄是因为翻译营销网站的成本与翻译产品内文案的成本不同。

以下内容解释了为什么这些数字不相同。


为什么没有一个单一的数字

翻译平台并非单一产品。它至少包含以下三个方面:

  1. 实时语音管道 — 音频输入,一秒内输出翻译后的音频,适用于对延迟预算要求极高的会议。
  2. 实时文本管道 — 聊天消息和共享笔记,逐字翻译,并以观众所选语言分发给每位观看者。
  3. 异步文档管道 — 将一个 40 页的 PDF 文件拖放到聊天中,作为完整文件进行翻译,同时保留格式和结构。

每个管道都有自己的引擎、自己的延迟预算和自己的逐对质量范围。对于文档来说是生产级的语言(缓慢、仔细、多次处理),对于实时语音(快速、一次性、无重试)来说可能无法使用。将这些视为“一个语言数量”正是那些声称“200多种语言”但毫无意义的营销页面产生的原因。

因此我们按界面发布。


1. 平台 API — 24 种语言

这是最广泛的列表,因为它代表了引擎界面。createParticipant 端点 接受以下 24 种语言代码:

ar, cs, da, de, en, es, fi, fr, hi, hu, is, it, ja, ko, nl, no, pl, pt, ro, ru, sv, tr, uk, zh

如果您是直接基于 Mind 进行构建的集成商,您可以将这 24 种语言中的任何一种分配给参与者。这并不意味着所有这 24 种语言都符合我们的产品质量标准。它意味着我们的引擎可以用该语言输出文本。产品会对此进行进一步的限制。


2. 产品内部的语音、聊天和笔记 — 21 种语言

当用户加入 InterMIND 会议时,语言选择器显示 21 种语言,而不是 24 种。其中移除了三种:阿拉伯语 (ar)、印地语 (hi)、土耳其语 (tr)。

为什么是这三种:这些语言对的质量均未达到我们在 `/benchmark` 上公布的平均质量标准。引擎会产生输出,但输出的质量不足以在受监管的会议中使用。因此,我们将其从选择器中隐藏,而不是让用户选择一种可能在审计师面前让他们尴尬的语言。

这是一个有意的选择。该类别中的大多数产品都采取相反的做法——列出模型可以输出的所有内容,让购买者在关键时刻才发现其中某个语言对存在问题。我们宁愿显示一个更小的选择器。

相同的 21 种语言列表适用于以下三个实时界面:

  • 语音翻译 — 为每位观众提供亚秒级延迟的翻译音频。每位参与者在通话开始时选择自己的听译语言。
  • 聊天消息 — 每条消息在输入时即被翻译;编辑会生成按语言划分的差异 (参见 v1.2)。
  • 共享笔记 — 逐字实时翻译主持人的笔记面板,为每位观看者提供,并附带差异历史记录。

一个选择器,一组 21 种语言,出现在三个地方。


3. 按需文件翻译 — 30 种语言

将 PDF、DOCX、PPTX 或 XLSX 文件拖放到聊天中。每位参与者都可以请求以自己的语言获取文件。翻译后的副本将以相同的文件格式返回,并保留结构(表格、标题、列表)。

此界面使用 DeepL 文档 API,目前支持 30 种目标语言——比我们的实时语音管道范围更广。我们直接提供了这项功能。如果您今天可以在 DeepL 上将 PDF 翻译成爱沙尼亚语,那么您今天就可以在 InterMIND 聊天中将其翻译成爱沙尼亚语。

DeepL 列表包含我们实时管道不支持的一些语言——例如保加利亚语、希腊语、爱沙尼亚语、印度尼西亚语、立陶宛语、拉脱维亚语、挪威语 (博克马尔)、斯洛伐克语、斯洛文尼亚语——值得注意的是,我们从语音中过滤掉的三种语言中有两种在这里可以用于文件:阿拉伯语和土耳其语适用于文件。 一位法国参与者可以请求土耳其语版本的合同 PDF,即使他们不能在会议中收听土耳其语。我们选择在选择器中标记这种不对称性,而不是隐藏它。

在我们的 API 中,支持任何管道的语言是:印地语。 引擎接受其作为输入,但无论是语音质量还是 DeepL 覆盖范围都尚未达到可交付的结果。它是唯一一种“API 上有,其他地方都没有”的语言。

文件列表通常更大的原因:

  • 文档是异步的。没有一秒钟的预算限制,因此管道可以采用更慢、更仔细的引擎,更好地处理更多的语言对。
  • DeepL 是同类最佳的文档翻译引擎,我们直接将其用于文件。我们不会尝试通过运行语音的相同引擎来处理文档。问题不同,工具也不同。

4. 网站 UI — 6 种语言

intermind.com 目前以 6 种区域设置提供:英语、德语、西班牙语(拉丁美洲)、法语、葡萄牙语(巴西)和简体中文。

为什么比产品范围窄得多:

  • 营销网站有其自身的翻译成本——以及其自身的质量标准。着陆页、常见问题、定价、法律条款。这不是免费的。
  • 我们根据流量和管道维护的合理性发布区域设置,而不是为产品支持的每种语言都提供。
  • 这 6 种语言是我们本季度实际的自然流量和采购流量来源。

随着管道的增长,这个列表也会增加。它并非原则上限制在六个,而是出于成本考虑。


这种模式,以及如何在任何供应商页面上解读它

每个多语言供应商都有这些相同的界面。他们中的大多数会引用最广泛的那个,然后让您自己去发现其他的。诚实的版本是:

  • 引擎列表最广,因为这是模型输出的内容。
  • 产品列表较窄,因为并非所有引擎输出都符合产品标准。
  • 文档列表通常与语音列表不同,因为引擎不同。
  • 网站列表最窄,因为翻译您自己的网站需要花费资金。

当您评估此类别中的任何平台时,请单独询问这四个数字。如果供应商拒绝拆分它们——或者不知道——您就不会得到有用的答案。


我们不会假装

  • 这三种被过滤的语言是真实存在的。 我们的引擎接受阿拉伯语、印地语和土耳其语。我们将其从语音/聊天/笔记选择器中移除,因为它们未能达到我们公开的质量标准。阿拉伯语和土耳其语仍然在文件管道中可用(DeepL 能够很好地处理这些文档)。印地语在实时或文件管道中都不可用——我们不会发布它,直到任一方达到要求。
  • 文件列表 (30 种) 比语音列表 (21 种) 更广是一个真实存在的差距,而非一项功能。 一位法国用户可以请求 PDF 的爱沙尼亚语翻译,但却不能在会议中收听爱沙尼亚语。我们不会通过引用更大的数字来掩盖这一点,并希望您不会注意到。
  • 网站区域设置列表 (6 种) 是产品债务,而非产品原则。 我们会随着流量的增长而发布更多。

亲自尝试

  • `/demo` — 以 21 种产品语言中的任意一种,针对您的音频运行生产语音 + 聊天管道。与评估 `/benchmark` 的管道相同。
  • `/benchmark` — 基于真实流量的每月逐对质量评估。包含我们特意从选择器中隐藏的语言对,可通过 URL 进行深层链接。
  • `/benchmark/methodology` — 这些数字是什么,不是什么,以及评判标准是谁。

六个数字,六个界面,一个引擎。这就是“你们支持多少种语言”这个问题的诚实答案。

— Mind.com 团队