Methodik

"Wie viele Sprachen unterstützen Sie?" — und warum unsere ehrliche Antwort sechs Zahlen sind, nicht eine

Jeder Anbieter nennt eine Sprachanzahl. Wir können das nicht, denn Übersetzung ist kein einzelnes Produkt. Hier ist die Aufschlüsselung pro Oberfläche für InterMIND — was gefiltert wird, warum, und was wir auf der Website veröffentlichen.

The Mind.com Team

"Wie viele Sprachen unterstützen Sie?" — und warum unsere ehrliche Antwort sechs Zahlen sind, nicht eine

"Wie viele Sprachen unterstützen Sie?" — und warum unsere ehrliche Antwort sechs Zahlen sind, nicht eine

Es ist die erste Frage in jedem Beschaffungsgespräch und die erste Frage in jeder Demo. Wir hören sie dreimal pro Woche:

"Wie viele Sprachen unterstützt InterMIND?"

Die ehrliche Antwort ist: es hängt davon ab, welche Oberfläche Sie meinen. Wir haben sechs davon, und sie haben aus guten Gründen unterschiedliche Sprachlisten. Diese Seite ist die definitive Antwort, damit wir keine inkonsistenten mehr geben.


Die Kurzversion

OberflächeSprachen
Plattform-API (createParticipant akzeptiert)24
Echtzeit-Sprachübersetzung in Meetings21
Echtzeit-Chat-Nachrichtenübersetzung21
Echtzeit-Übersetzung geteilter Notizen21
On-demand-Dateienübersetzung im Chat (DeepL Document API)30
Website-UI (lokalisiert unter intermind.com)6

Das Produkt unterstützt 21 Sprachen. Dateien: 30. Website: 6. API-Engine: 24.

Sprache, Chat und Notizen teilen sich die gleichen 21. Dateien sind umfangreicher, weil die Dateipipeline dies sein kann. Die Website ist weniger umfangreich, weil die Übersetzung einer Marketingseite andere Kosten verursacht als die Übersetzung von In-Product-Texten.

Alles unten erklärt, warum diese Zahlen nicht gleich sind.


Warum es keine einzelne Zahl gibt

Eine Übersetzungsplattform ist kein einzelnes Produkt. Sie besteht aus mindestens drei:

  1. Eine Echtzeit-Sprach-Pipeline — Audio rein, übersetztes Audio raus unter einer Sekunde, in einem Meeting, wo das Latenzbudget brutal ist.
  2. Eine Echtzeit-Text-Pipeline — Chat-Nachrichten und geteilte Notizen, Zeichen für Zeichen, für jeden Betrachter in seiner Sprache bereitgestellt.
  3. Eine asynchrone Dokument-Pipeline — ein 40-seitiges PDF, das in den Chat gezogen und als ganze Datei mit Formatierung und Struktur übersetzt wird.

Jede Pipeline hat ihre eigene Engine, ihr eigenes Latenzbudget und ihre eigene qualitätsbezogene Leistung pro Sprachpaar. Eine Sprache, die für Dokumente produktionsreif ist (langsam, sorgfältig, viele Durchläufe), kann für Live-Sprache unbrauchbar sein (schnell, einmalig, keine Wiederholungen). Diese als "eine Sprachanzahl" zu behandeln, führt zu Marketingseiten, die "200+ Sprachen" angeben und nichts aussagen.

Daher veröffentlichen wir die Zahlen pro Oberfläche.


1. Plattform-API — 24 Sprachen

Dies ist die umfangreichste Liste, da es sich um die Engine-Oberfläche handelt. Der createParticipant Endpunkt akzeptiert diese 24 Codes:

ar, cs, da, de, en, es, fi, fr, hi, hu, is, it, ja, ko, nl, no, pl, pt, ro, ru, sv, tr, uk, zh

Wenn Sie ein Integrator sind, der direkt auf Mind aufbaut, können Sie einem Teilnehmer jede dieser 24 Sprachen zuweisen. Das bedeutet nicht, dass jede dieser 24 Sprachen unseren Produktqualitätsstandards entspricht. Es bedeutet, dass unsere Engine Text in dieser Sprache ausgeben kann. Das Produkt schränkt dies weiter ein.


2. Sprache, Chat und Notizen innerhalb des Produkts — 21 Sprachen

Wenn ein Benutzer einem InterMIND-Meeting beitritt, zeigt die Sprachauswahl 21 Sprachen an, nicht 24. Drei werden entfernt: Arabisch (ar), Hindi (hi), Türkisch (tr).

Warum diese drei: Jedes dieser Paare erreicht nicht den Qualitätsstandard, den wir auf /benchmark veröffentlichen. Die Engine produziert zwar eine Ausgabe, aber die Ausgabe ist nicht gut genug, um sie in einem regulierten Meeting zu verwenden. Daher verbergen wir sie in der Auswahl, anstatt einem Benutzer die Wahl einer Sprache zu überlassen, die ihn vor einem Prüfer in Verlegenheit bringen würde.

Dies ist eine bewusste Entscheidung. Die meisten Anbieter in dieser Kategorie gehen den anderen Weg – sie listen alles auf, was das Modell ausgeben kann, und lassen den Käufer im falschen Moment feststellen, dass eines dieser Paare fehlerhaft ist. Wir ziehen es vor, eine kleinere Auswahl anzuzeigen.

Dieselbe Liste mit 21 Sprachen gilt für die drei Echtzeit-Oberflächen:

  • Sprachübersetzung — für jeden Betrachter übersetztes Audio mit Sub-Sekunden-Latenz. Jeder Teilnehmer wählt zu Beginn des Anrufs seine eigene Hörsprache.
  • Chat-Nachrichten — jede Nachricht wird während der Eingabe übersetzt; Bearbeitungen erzeugen sprachspezifische Diffs (siehe v1.2).
  • Geteilte Notizen — Zeichen-für-Zeichen-Live-Übersetzung des Notizbereichs des Hosts, pro Betrachter, mit Diff-Verlauf.

Eine Auswahl, ein Satz von 21 Sprachen, drei Stellen, an denen sie angezeigt wird.


3. On-demand-Dateienübersetzung — 30 Sprachen

Ziehen Sie ein PDF, DOCX, PPTX oder XLSX in den Chat. Jeder Teilnehmer kann die Datei in seiner Sprache anfordern. Die übersetzte Kopie wird im selben Dateiformat mit erhaltener Struktur (Tabellen, Überschriften, Listen) zurückgegeben.

Diese Oberfläche verwendet die DeepL Document API, die derzeit 30 Zielsprachen unterstützt – umfangreicher als unsere Echtzeit-Sprach-Pipeline. Wir leiten diese Funktion direkt weiter. Wenn Sie ein PDF heute mit DeepL ins Estnische übersetzen können, können Sie es heute im InterMIND-Chat ins Estnische übersetzen.

Die DeepL-Liste enthält einige Sprachen, die unsere Echtzeit-Pipeline nicht hat – zum Beispiel Bulgarisch, Griechisch, Estnisch, Indonesisch, Litauisch, Lettisch, Norwegisch Bokmål, Slowakisch, Slowenisch – und bemerkenswerterweise zwei der drei, die wir aus der Sprachausgabe filtern: Arabisch und Türkisch funktionieren für Dateien. Ein französischer Teilnehmer kann das Vertrags-PDF auf Türkisch anfordern, auch wenn er dem Meeting nicht auf Türkisch zuhören kann. Wir kennzeichnen diese Asymmetrie in der Auswahl, anstatt sie zu verbergen.

Die einzige Sprache in unserer API, die auf keiner der Pipelines verfügbar ist: Hindi. Die Engine akzeptiert sie als Eingabe, aber weder die Sprachqualität noch die DeepL-Abdeckung führen uns bisher zu einem lieferbaren Ergebnis. Es ist die einzige Sprache, die "in der API, aber überall sonst deaktiviert" ist.

Warum die Dateiliste im Allgemeinen größer ist:

  • Dokumente sind asynchron. Es gibt kein Ein-Sekunden-Budget, sodass die Pipeline eine langsamere, sorgfältigere Engine verwenden kann, die mehr Paare gut verarbeitet.
  • DeepL ist die beste Dokumentübersetzungs-Engine ihrer Klasse, und wir verwenden sie direkt für Dateien. Wir versuchen nicht, Dokumente durch dieselbe Engine zu leiten, die auch Sprache verarbeitet. Anderes Problem, anderes Werkzeug.

4. Website-UI — 6 Sprachen

intermind.com wird derzeit in 6 Lokalisierungen ausgeliefert: Englisch, Deutsch, Spanisch (Lateinamerika), Französisch, Portugiesisch (Brasilianisch) und Chinesisch (vereinfacht).

Warum viel weniger umfangreich als das Produkt:

  • Eine Marketingseite hat ihre eigenen Übersetzungskosten — und ihre eigenen Qualitätsstandards. Landing Pages, FAQs, Preise, Rechtstexte. Das ist nicht kostenlos.
  • Wir liefern Lokalisierungen dort aus, wo Traffic und Pipeline die Wartung rechtfertigen, nicht für jede vom Produkt unterstützte Sprache.
  • Die 6 ausgewählten sind diejenigen, aus denen in diesem Quartal unser tatsächlicher organischer und Beschaffungs-Traffic stammt.

Diese Liste wird wachsen, wenn die Pipeline wächst. Sie ist nicht prinzipiell auf sechs begrenzt. Sie ist aus Kostengründen auf sechs begrenzt.


Das Muster und wie man es auf jeder Anbieterseite liest

Jeder mehrsprachige Anbieter hat dieselben Oberflächen. Die meisten von ihnen nennen Ihnen die umfangreichste und lassen Sie die anderen selbst entdecken. Die ehrliche Version ist:

  • Die Engine-Liste ist die umfangreichste, weil sie das ist, was das Modell ausgibt.
  • Die Produkt-Liste ist enger, weil nicht jede Engine-Ausgabe einem Produktstandard entspricht.
  • Die Dokument-Liste unterscheidet sich oft von der Sprach-Liste, weil die Engines unterschiedlich sind.
  • Die Website-Liste ist die engste, weil die Übersetzung Ihrer eigenen Website Geld kostet.

Wenn Sie eine Plattform in dieser Kategorie evaluieren, fragen Sie nach den vier Zahlen separat. Wenn ein Anbieter sich weigert, sie aufzuschlüsseln – oder es nicht weiß – erhalten Sie keine nützliche Antwort.


Was wir nicht vortäuschen werden

  • Die drei gefilterten Sprachen sind real. Unsere Engine akzeptiert Arabisch, Hindi und Türkisch. Wir entfernen sie aus der Sprach-/Chat-/Notizen-Auswahl, weil sie unseren öffentlichen Qualitätsstandard nicht erfüllen. Arabisch und Türkisch sind weiterhin über die Dateipipeline verfügbar (DeepL verarbeitet diese Dokumente gut). Hindi ist weder in Echtzeit noch für Dateien verfügbar – wir werden es erst ausliefern, wenn eine der beiden Seiten dies erreicht.
  • Die Tatsache, dass die Dateiliste (30) umfangreicher ist als die Sprachliste (21), ist eine echte Lücke und keine Funktion. Ein französischer Benutzer kann eine estnische Übersetzung des PDF anfordern, kann aber dem Meeting nicht auf Estnisch zuhören. Wir werden dies nicht beschönigen, indem wir die größere Zahl angeben und hoffen, dass Sie es nicht bemerken.
  • Die Liste der Website-Sprachen (6) ist technische Schuld, kein Produktprinzip. Wir liefern mehr aus, sobald der Traffic dies rechtfertigt.

Probieren Sie es selbst aus

  • /demo — führt die Produktions-Sprach- + Chat-Pipeline gegen Ihr Audio in jeder der 21 Produktsprachen aus. Dieselbe Pipeline, die /benchmark bewertet.
  • /benchmark — Qualität pro Paar und pro Monat auf realem Traffic. Enthält die Paare, die wir absichtlich aus der Auswahl ausblenden, über URL direkt verlinkbar.
  • /benchmark/methodology — was die Zahlen sind, was sie nicht sind, wer der Richter ist.

Sechs Zahlen, sechs Oberflächen, eine Engine. Das ist die ehrliche Antwort auf die Frage "Wie viele Sprachen unterstützen Sie?".

— Das Mind.com Team