NMÜ-Modell (neuronale maschinelle Übersetzung)
Die Erkennungs-Engine der Translation API unterstützt eine Vielzahl von Sprachen für das neuronale maschinelle Übersetzungsmodell (Neural Machine Translation, NMT).
Diese Sprachen werden innerhalb einer Erkennungsanfrage mithilfe von Sprachcodeparametern angegeben, die auf dieser Seite beschrieben sind. Die meisten Sprachcodeparameter entsprechen dem ISO-639, sofern nicht anders angegeben.
Es werden Übersetzungen aus einer beliebigen Sprache in eine beliebige Sprache in dieser Liste unterstützt. Transkription und Transliteration werden nur in der Cloud Translation Advanced API unterstützt. Die Liste wird aktualisiert, sobald neue Sprachen verfügbar sind. Eine Liste der unterstützten Sprachen kann auch mithilfe der APIs Cloud Translation - Basic oder Cloud Translation - Advanced abgerufen werden.
Überzeugen Sie sich selbst
Wenn Sie mit Google Cloud noch nicht vertraut sind, erstellen Sie einfach ein Konto, um die Leistungsfähigkeit von Cloud Translation in der Praxis prüfen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.
Cloud Translation kostenlos testen
Sprache | ISO-639-Code |
---|---|
Abchasisch | ab |
Achinesisch | ace |
Acholi | ach |
Afrikaans | af |
Albanisch | sq |
Alur | alz |
Amharisch | am |
Arabisch | ar |
Armenisch | hy |
Assamesisch | as |
Awadhi | awa |
Aymara | ay |
Aserbaidschanisch | az |
Balinesisch | ban |
Bambara | bm |
Baschkirisch | ba |
Baskisch | eu |
Karo-Batak | btx |
Batak Simalungun | bts |
Toba-Batak | bbc |
Belarussisch | be |
Bemba | bem |
Bengalisch | bn |
Betawi | bew |
Bhojpuri | bho |
Bikol | bik |
Bosnisch | bs |
Bretonisch | br |
Bulgarisch | bg |
Buryat (Russland) | bua |
Kantonesisch | yue |
Katalanisch | ca |
Cebuano | ceb |
Chichewa (Nyanja) | ny |
Chinesisch (vereinfacht) | zh-CN oder zh (BCP-47) |
Chinesisch (traditionell) | zh-TW (BCP-47) |
Tschuwaschisch | cv |
Korsisch | co |
Krimtatarisch | crh |
Kroatisch | hr |
Tschechisch | cs |
Dänisch | da |
Dinka | din |
Divehi | dv |
Dogri | doi |
Dombe | dov |
Niederländisch | nl |
Dzongkha | dz |
Englisch | en |
Esperanto | eo |
Estnisch | et |
Ewe | ee |
Fidschi | fj |
Philippinisch (Tagalog) | fil oder tl |
Finnisch | fi |
Französisch | fr |
Französisch (Frankreich) | fr-FR |
Französisch (Kanada) | fr-CA |
Friesisch | fy |
Fulfulde | ff |
Ga | gaa |
Galizisch | gl |
Ganda (Luganda) | lg |
Georgisch | ka |
Deutsch | de |
Griechisch | el |
Guarani | gn |
Gujarati | gu |
Haitianisch | ht |
Hakha Chin | cnh |
Hausa | ha |
Hawaiisch | haw |
Hebräisch | iw oder he |
Hiligaynon | hil |
Hindi | hi |
Hmong | hmn |
Ungarisch | hu |
Hunsrückisch | hrx |
Isländisch | is |
Igbo | ig |
Ilokano | ilo |
Indonesisch | id |
Irisch | ga |
Italienisch | it |
Japanisch | ja |
Javanisch | jw oder jv |
Kannada | kn |
Kapampangan | pam |
Kasachisch | kk |
Khmer | km |
Kiga | cgg |
Kinyarwanda | rw |
Kituba | ktu |
Konkani | gom |
Koreanisch | ko |
Krio | kri |
Kurdisch (Kurmandschi) | ku |
Kurdisch (Sorani) | ckb |
Kirgisisch | ky |
Lao | lo |
Lettgallisch | ltg |
Latein | la |
Lettisch | lv |
Ligurisch | lij |
Limburgisch | li |
Lingala | ln |
Litauisch | lt |
Lombardisch | lmo |
Luo | luo |
Luxemburgisch | lb |
Mazedonisch | mk |
Maithili | mai |
Makassar | mak |
Malagasy | mg |
Malaiisch | ms |
Malaiisch (Jawi) | ms-Arab |
Malayalam | ml |
Maltesisch | mt |
Maori | mi |
Marathi | mr |
Wiesenmari | chm |
Meiteilon (Manipuri) | mni-Mtei |
Minangkabauisch | min |
Mizo | lus |
Mongolisch | mn |
Birmanisch | my |
Ndebele (Süd) | nr |
Nepal Bhasa (Newari) | new |
Nepali | ne |
Nord-Sotho (Sepedi) | nso |
Norwegisch | no |
Nuer | nus |
Okzitanisch | oc |
Odia (Oriya) | or |
Oromo | om |
Pangasinensisch | pag |
Papiamento | pap |
Paschtu | ps |
Persisch | fa |
Polnisch | pl |
Portugiesisch | pt |
Portugiesisch (Portugal) | pt-PT |
Portugiesisch (Brasilien) | pt-BR |
Panjabi | pa |
Panjabi (Shahmukhi) | pa-Arab |
Quechua | qu |
Romani | rom |
Rumänisch | ro |
Kirundi | rn |
Russisch | ru |
Samoanisch | sm |
Sango | sg |
Sanskrit | sa |
Schottisches Gälisch | gd |
Serbisch | sr |
Sesotho | st |
Seychellenkreol | crs |
Shan | shn |
Shona | sn |
Sizilianisch | scn |
Schlesisch | szl |
Sindhi | sd |
Singhalesisch | si |
Slowakisch | sk |
Slowenisch | sl |
Somali | so |
Spanisch | es |
Sundanesisch | su |
Swahili | sw |
Siswati | ss |
Schwedisch | sv |
Tadschikisch | tg |
Tamil | ta |
Tatarisch | tt |
Telugu | te |
Tetum | tet |
Thailändisch | th |
Tigrinya | ti |
Tsonga | ts |
Setswana | tn |
Türkisch | tr |
Turkmenisch | tk |
Twi (Akan) | ak |
Ukrainisch | uk |
Urdu | ur |
Uigurisch | ug |
Usbekisch | uz |
Vietnamesisch | vi |
Walisisch | cy |
Xhosa | xh |
Jiddisch | yi |
Yoruba | yo |
Mayathan | yua |
Zulu | zu |
Unterstützung von Transkription und Transliteration
Transkription und Transliteration werden für die folgenden Sprachen unterstützt.
Sprache | ISO-639-Code | Transkription | Transliteration |
---|---|---|---|
Arabisch | ar |
||
Amharisch | am |
||
Bengalisch | bn |
||
Belarussisch | be |
||
Gujarati | gu |
||
Hindi | hi |
||
Japanisch | ja |
||
Kannada | kn |
||
Myanmar | uk |
||
Russisch | ru |
||
Serbisch | sr |
||
Tamil | ta |
||
Telugu | te |
||
Ukrainisch | uk |
Benutzerdefinierte Modelle
Für Cloud Translation Advanced unterstützt AutoML Translation die folgenden Sprachpaare für benutzerdefinierte Modelle. Wird eine Sprache unterstützt, bietet Google dafür ein NMÜ-Modell (neuronale maschinelle Übersetzung). Dieses Modell wird von AutoML Translation beim Training als Basis für das Erstellen eines benutzerdefinierten Modells verwendet.
Sprachenpaar | Sprachcodes |
---|---|
Afrikaans <-> Englisch | af <-> en |
Albanisch <-> Englisch | sq <-> en |
Arabisch <-> Englisch | ar <-> en |
Aserbaidschanisch <-> Englisch | az <-> en |
Bengalisch <-> Englisch | bn <-> en |
Bulgarisch <-> Englisch | bg <-> en |
Katalanisch <-> Englisch | ca <-> en |
Chinesisch (vereinfacht) <-> Englisch | zh-CN * <-> en |
Chinesisch (traditionell) <-> Englisch | zh-TW <-> en |
Kroatisch <-> Englisch | hr <-> en |
Tschechisch <-> Englisch | cs <-> en |
Dänisch <-> Englisch | da <-> en |
Niederländisch <-> Englisch | nl <-> en |
Estnisch <-> Englisch | et <-> en |
Finnisch <-> Englisch | fi <-> en |
Französisch <-> Englisch | fr <-> en |
Galizisch <-> Englisch | gl <-> en |
Georgisch <-> Englisch | ka <-> en |
Deutsch <-> Englisch | de <-> en |
Griechisch <-> Englisch | el <-> en |
Gujarati <-> Englisch | gu <-> en |
Haitianisches Kreolisch <-> Englisch | ht <-> en |
Hebräisch <-> Englisch | iw <-> en |
Hindi <-> Englisch | hi <-> en |
Ungarisch <-> Englisch | hu <-> en |
Isländisch <-> Englisch | is <-> en |
Indonesisch <-> Englisch | id <-> en |
Italienisch <-> Englisch | it <-> en |
Japanisch <-> Englisch | ja <-> en |
Koreanisch <-> Englisch | ko <-> en |
Lettisch <-> Englisch | lv <-> en |
Litauisch <-> Englisch | lt <-> en |
Malaiisch <-> Englisch | ms <-> en |
Marathi <-> Englisch | mr <-> en |
Norwegisch <-> Englisch | no <-> en |
Persisch <-> Englisch | fa <-> en |
Polnisch <-> Englisch | pl <-> en |
Portugiesisch <-> Englisch | pt <-> en |
Punjabi <-> Englisch | pa <-> en |
Rumänisch <-> Englisch | ro <-> en |
Russisch <-> Englisch | ru <-> en |
Serbisch <-> Englisch | sr <-> en |
Slowakisch <-> Englisch | sk <-> en |
Slowenisch <-> Englisch | sl <-> en |
Spanisch <-> Englisch | es <-> en |
Swahili <-> Englisch | sw <-> en |
Schwedisch <-> Englisch | sv <-> en |
Thai <-> Englisch | th <-> en |
Türkisch <-> Englisch | tr <-> en |
Ukrainisch <-> Englisch | uk <-> en |
Urdu <-> Englisch | ur <-> en |
Vietnamesisch <-> Englisch | vi <-> en |
Walisisch <-> Englisch | cy <-> en |
* Chinesisch (vereinfacht) kann entweder durch zh-CN
oder zh
angegeben werden.
Unterstützte Codes für Sprachvarianten
Die folgenden Sprachcodes sind Varianten der in der vorherigen Tabelle unterstützten Sprachen. Sie können diese Codes beim Erstellen von Datasets als Quell- oder Zielsprache verwenden.
Google bietet für diese Sprachen keine NMÜ-Basismodelle. Stattdessen verwendet Cloud Translation zum Trainieren benutzerdefinierte Modelle das zugehörige Basismodell der Sprachvariante.
Die Verwendung dieser Codes ist beispielsweise hilfreich, wenn Sie Inhalte für einen bestimmten Dialekt oder eine bestimmte Region übersetzen. Angenommen, Sie haben lokalisierte Daten für zh-HK
, für die Sie ein benutzerdefiniertes Modell erstellen. Für Übersetzungen können Sie den Sprachcode zh-HK
angeben, der auf Ihr benutzerdefiniertes Modell verweist und exaktere Übersetzungen für diese Sprache liefert.
In der folgenden Tabelle sind die Sprachcodes, eine entsprechende Beschreibung und das jeweils zugehörige Basismodell aufgeführt, das Cloud Translation beim Trainieren benutzerdefinierter Modelle verwendet.
Sprachcode | Beschreibung | Basismodell |
---|---|---|
zh-HK |
Hongkong (traditionell) | zh-TW |
Von der Übersetzungs-LLM unterstützte Sprachen
Die folgenden Sprachpaare werden für Textübersetzungen mit dem Übersetzungs-LLM und für adaptive Übersetzungen unterstützt.
Sprachenpaar | Sprachcodes |
---|---|
Arabisch <-> Englisch | ar <-> en |
Chinesisch (vereinfacht) <-> Englisch | zh-CN <-> en |
Tschechisch <-> Englisch | cs <-> en |
Niederländisch <-> Englisch | nl <-> en |
Französisch <-> Englisch | fr <-> en |
Deutsch <-> Englisch | de <-> en |
Hindi <-> Englisch | hi <-> en |
Indonesisch <-> Englisch | id <-> en |
Italienisch <-> Englisch | it <-> en |
Japanisch <-> Englisch | ja <-> en |
Koreanisch <-> Englisch | ko <-> en |
Polnisch <-> Englisch | pl <-> en |
Portugiesisch <-> Englisch | pt <-> en |
Russisch <-> Englisch | ru <-> en |
Spanisch <-> Englisch | es <-> en |
Thai <-> Englisch | th <-> en |
Türkisch <-> Englisch | tr <-> en |
Ukrainisch <-> Englisch | uk <-> en |
Vietnamesisch <-> Englisch | vi <-> en |