"Сколько языков вы поддерживаете?" — и почему наш честный ответ состоит из шести чисел, а не одного
"Сколько языков вы поддерживаете?" — и почему наш честный ответ состоит из шести чисел, а не одного
Это первый вопрос на каждом звонке с закупками и первый вопрос на каждой демонстрации. Мы слышим его три раза в неделю:
"Сколько языков поддерживает InterMIND?"
Честный ответ: это зависит от того, какую поверхность вы имеете в виду. У нас их шесть, и у них разные списки языков по уважительным причинам. Эта страница — окончательный ответ, чтобы мы перестали давать противоречивые.
Краткая версия
| Поверхность | Языки |
|---|---|
API платформы (принимает createParticipant) | 24 |
| Перевод голоса в реальном времени на встречах | 21 |
| Перевод сообщений чата в реальном времени | 21 |
| Перевод общих заметок в реальном времени | 21 |
| Перевод файлов по запросу в чате (DeepL Document API) | 30 |
| Пользовательский интерфейс сайта (локализован на intermind.com) | 6 |
Продукт — 21 язык. Файлы: 30. Сайт: 6. Движок API: 24.
Голос, чат и заметки используют одни и те же 21 язык. Файлы шире, потому что файловый конвейер может быть таким. Сайт уже, потому что перевод маркетингового сайта — это другая стоимость, чем перевод внутрипродуктового контента.
Все ниже объясняет, почему эти числа не совпадают.
Почему нет единого числа
Платформа перевода — это не один продукт. Это как минимум три:
- Конвейер речи в реальном времени — аудио на входе, переведенное аудио на выходе менее чем за секунду, на встрече, где бюджет задержки является очень жестким.
- Текстовый конвейер в реальном времени — сообщения чата и общие заметки, символ за символом, распространяемые каждому зрителю на его языке.
- Асинхронный конвейер документов — 40-страничный PDF-файл, помещенный в чат, переведенный как целый файл с сохранением форматирования и структуры.
Каждый конвейер имеет свой собственный движок, свой собственный бюджет задержки и свой собственный уровень качества для каждой языковой пары. Язык, который готов к использованию в продакшене для документов (медленный, тщательный, много проходов), может быть непригоден для живого голоса (быстрый, один проход, без повторных попыток). Рассматривать это как "одно количество языков" приводит к появлению маркетинговых страниц, которые говорят "200+ языков" и ничего не объясняют.
Поэтому мы публикуем информацию для каждой поверхности отдельно.
1. API платформы — 24 языка
Это самый широкий список, потому что это поверхность движка. Конечная точка createParticipant принимает следующие 24 кода:
ar, cs, da, de, en, es, fi, fr, hi, hu, is, it, ja, ko, nl, no, pl, pt, ro, ru, sv, tr, uk, zh
Если вы являетесь интегратором, строящимся непосредственно на Mind, вы можете передать любой из этих 24 языков участнику. Это не означает, что каждый из этих 24 языков соответствует нашим стандартам качества продукта. Это означает, что наш движок может выдавать текст на этом языке. Продукт это еще больше ограничивает.
2. Голос, чат и заметки внутри продукта — 21 язык
Когда пользователь присоединяется к встрече InterMIND, выбор языка показывает 21 язык, а не 24. Три языка удалены: арабский (ar), хинди (hi), турецкий (tr).
Почему именно эти три: ни одна из этих пар не соответствует медианному порогу качества, который мы публикуем на /benchmark. Движок производит вывод. Вывод недостаточно хорош, чтобы представить его на регулируемой встрече. Поэтому мы скрываем их из списка выбора, вместо того чтобы позволить пользователю выбрать язык, который поставит его в неловкое положение перед аудитором.
Это осознанный выбор. Большая часть категории поступает иначе — перечисляет все, что модель может выдать, позволяя покупателю обнаружить в неподходящий момент, что одна из этих пар не работает. Мы предпочли бы показать меньший список выбора.
Тот же список из 21 языка применяется для трех поверхностей реального времени:
- Голосовой перевод — переведенное аудио для каждого зрителя с задержкой менее секунды. Каждый участник выбирает свой язык прослушивания в начале звонка.
- Сообщения чата — каждое сообщение переводится по мере набора; редактирование приводит к различиям на каждом языке (см. v1.2).
- Общие заметки — живой перевод панели заметок организатора, символ за символом, для каждого зрителя, с историей изменений.
Один список выбора, один набор из 21 языка, три места, где он отображается.
3. Перевод файлов по запросу — 30 языков
Перетащите PDF, DOCX, PPTX или XLSX в чат. Каждый участник может запросить файл на своем языке. Переведенная копия возвращается в том же формате файла с сохранением структуры (таблицы, заголовки, списки).
Эта поверхность использует DeepL Document API, который в настоящее время поддерживает 30 целевых языков — шире, чем наш голосовой конвейер реального времени. Мы напрямую передаем эту возможность. Если вы можете перевести PDF на эстонский с помощью DeepL сегодня, вы можете перевести его на эстонский в чате InterMIND сегодня.
Список DeepL включает некоторые языки, которых нет в нашем конвейере реального времени — например, болгарский, греческий, эстонский, индонезийский, литовский, латышский, норвежский букмол, словацкий, словенский — и, что примечательно, два из трех, которые мы фильтруем из голосового перевода: арабский и турецкий работают для файлов. Французский участник может запросить PDF контракта на турецком языке, хотя он не может слушать встречу на турецком. Мы отмечаем эту асимметрию в списке выбора, а не скрываем ее.
Единственный язык в нашем API, который не доступен ни в одном из конвейеров: хинди. Движок принимает его в качестве входных данных, но ни качество голоса, ни покрытие DeepL пока не позволяют нам получить готовый результат. Это единственный язык, который "есть в API, но отсутствует везде".
Почему список файлов в целом больше:
- Документы асинхронны. Нет бюджета в одну секунду, поэтому конвейер может позволить себе более медленный, более тщательный движок, который хорошо обрабатывает больше пар.
- DeepL — это лучший в своем классе движок для перевода документов, и мы используем его напрямую для файлов. Мы не пытаемся маршрутизировать документы через тот же движок, который обрабатывает голос. Другая проблема, другой инструмент.
4. Пользовательский интерфейс сайта — 6 языков
intermind.com в настоящее время доступен на 6 локалях: английском, немецком, испанском (Латинская Америка), французском, португальском (бразильский) и китайском (упрощенный).
Почему намного уже, чем продукт:
- Маркетинговый сайт имеет свои собственные затраты на перевод — и свои собственные стандарты качества. Целевые страницы, часто задаваемые вопросы, цены, юридические тексты. Это не бесплатно.
- Мы выпускаем локали там, где трафик и конвейер оправдывают обслуживание, а не для каждого языка, поддерживаемого продуктом.
- Выбранные 6 — это те, откуда приходит наш фактический органический трафик и трафик закупок в этом квартале.
Этот список будет расти по мере роста конвейера. Он не ограничен шестью по принципу. Он ограничен шестью по стоимости.
Паттерн и как его читать на странице любого поставщика
У каждого многоязычного поставщика есть одни и те же поверхности. Большинство из них называют вам самый широкий список и позволяют вам самостоятельно обнаружить остальные. Честная версия такова:
- Список движков самый широкий, потому что это то, что выдает модель.
- Список продуктов уже, потому что не каждый вывод движка соответствует требованиям продукта.
- Список документов часто отличается от списка голосовых переводов, потому что движки разные.
- Список сайтов самый узкий, потому что перевод вашего собственного сайта стоит денег.
При оценке любой платформы в этой категории запросите четыре числа отдельно. Если поставщик отказывается их разделить — или не знает — вы не получите полезного ответа.
Что мы не будем притворяться
- Три отфильтрованных языка реальны. Наш движок принимает арабский, хинди и турецкий. Мы исключаем их из списка выбора голоса/чата/заметок, потому что они не соответствуют нашему публичному стандарту качества. Арабский и турецкий по-прежнему доступны в файловом конвейере (DeepL хорошо обрабатывает эти документы). Хинди недоступен ни в реальном времени, ни для файлов — мы не будем выпускать его, пока одна из сторон не достигнет нужного уровня.
- То, что список файлов (30) шире списка голосового перевода (21), является реальным пробелом, а не особенностью. Французский пользователь может запросить эстонский перевод PDF, но не может слушать встречу на эстонском. Мы не будем скрывать это, называя большее число и надеясь, что вы не заметите.
- Список локалей сайта (6) — это технический долг, а не принцип продукта. Мы выпускаем больше по мере того, как трафик это оправдывает.
Попробуйте сами
/demo— запускает производственный голосовой + чат-конвейер для вашего аудио на любом из 21 языка продукта. Тот же конвейер, который используется для оценки/benchmark./benchmark— качество по парам, по месяцам на реальном трафике. Включает пары, которые мы намеренно скрываем из списка выбора, с возможностью прямой ссылки по URL./benchmark/methodology— что означают цифры, чего они не означают, кто судья.
Шесть чисел, шесть поверхностей, один движок. Это честный ответ на вопрос "сколько языков вы поддерживаете".
— Команда Mind.com
Ловушка ложной беглости: когда «достаточно хорошего» английского хуже, чем отсутствия английского
Авиационные регуляторы ввели обязательные требования после Тенерифе и Авианки. Медицинская литература квантифицирует это вплоть до подсчета ошибок на каждый прием пациента. Сорок лет исследований международного бизнеса документируют тот же механизм в переговорной. Почему частичная беглость в общем языке хуже, чем отсутствие общего языка вообще — с данными.
Внутри четырех конвейеров перевода, которые обеспечивают работу InterMIND
В InterMIND нет понятия «единственного перевода». Существуют четыре конвейера — голосовой, чат, заметки, документы — каждый со своим движком, бюджетом задержки и уровнем качества. Вот что на самом деле происходит между моментом, когда вы говорите, и моментом, когда участник на другом языке вас понимает.