Передплата 2024 «Добрий господар»

110 мов з’явиться у Google Translate

  • 28.06.2024, 11:45
  • 319

Компанія Google оголосила, що додає у свій перекладач Google Translate 110 мов

Фото: Tech Crunch
Фото: Tech Crunch

Про це повідомляє Tech Crunch.

Для перекладу компанія використовувала свою модель штучного інтелекту PaLM 2.

«Серед цих мов — афарська, кантонська, мансійська, нко, пенджабська (шахмухі), тамазітська (амазигська) і ток пісін. Компанія заявила, що додані мови представляють понад 614 мільйонів носіїв, або приблизно 8% населення світу», — йдеться у повідомленні.

У Google зазначили, що ці мови перебувають на різних стадіях використання. Деякі з них налічують 100 мільйонів носіїв, а деякі не мають жодного активного носія, але люди працюють над збереженням цих мов.

У Google заявили, що враховують такі елементи, як регіональні різновиди, діалекти та різні стандарти правопису, додаючи підтримку тієї чи іншої мови.

«Наш підхід полягає в тому, щоб надати пріоритет найбільш часто використовуваним різновидам кожної мови. Наприклад, ромська мова має багато діалектів по всій Європі. Наші моделі створюють текст, найбільш близький до південного варіанту ромської мови (Southern Vlax Romani), який часто використовується в Інтернеті. Але в ньому також змішуються елементи з інших мов, таких як північний влакс і балканська ромська», — сказав Іссак Касвелл, інженер-програміст Google.

Компанія назвала кілька мов, які будуть підтримуватись в Google Перекладачі:

Афар — це тональна мова, якою розмовляють у Джибуті, Еритреї та Ефіопії.

Кантонська мова — вона вже давно є однією з найбільш запитуваних мов для Google Перекладача.

Кримськотатарська мова — тюркська мова, рідна мова кримських татар. Сьогодні кримськотатарська належить до мов, що потребує додаткового захисту за класифікацією UNESCO.

Менська — це кельтська мова острова Мен.

Нко — це стандартизована форма західноафриканських мов мандінка, яка об'єднує багато діалектів в одну спільну мову.

Панджабі (Шахмукхі) — це різновид панджабі, що пишеться персько-арабським письмом (шахмукхі), і є найпоширенішою мовою в Пакистані.

Тамазігська мова (амазігська) — це берберська мова, якою розмовляють у Північній Африці.

Ток-пісін — це креольська мова на основі англійської та мова міжнаціонального спілкування Папуа-Нової Гвінеї.

Схожі новини