Meta i UNESCO łączą siły w celu udoskonalenia technologii tłumaczenia i rozpoznawania mowy

W lutym 2025 roku firma Meta, znana wcześniej jako Facebook, ogłosiła nawiązanie współpracy z Organizacją Narodów Zjednoczonych ds. Edukacji, Nauki i Kultury (UNESCO) w celu uruchomienia programu Language Technology Partner Program. Celem tej inicjatywy jest rozwój i doskonalenie technologii sztucznej inteligencji (AI) w zakresie tłumaczenia oraz rozpoznawania mowy, ze szczególnym naciskiem na języki niedostatecznie reprezentowane w przestrzeni cyfrowej. ​

Cel programu

Language Technology Partner Program ma na celu wsparcie różnorodności językowej w świecie cyfrowym poprzez rozwój otwartoźródłowych technologii językowych. Meta, we współpracy z UNESCO, dąży do stworzenia inteligentnych systemów zdolnych do rozumienia i reagowania na złożone potrzeby użytkowników, niezależnie od ich języka czy kultury. ​

Współpraca z partnerami

Meta poszukuje partnerów, którzy mogą dostarczyć:​

  • Ponad 10 godzin nagrań mowy z transkrypcjami.​
  • Obszerne zbiory tekstów pisanych (ponad 200 zdań).​
  • Zestawy przetłumaczonych zdań w różnych językach.​

Zebrane dane zostaną wykorzystane do integracji tych języków z modelami AI do rozpoznawania mowy i tłumaczenia maszynowego. Po zakończeniu prac modele te zostaną udostępnione jako otwarte oprogramowanie, co umożliwi społeczności globalnej dalszy rozwój i adaptację technologii.

Pierwsi uczestnicy programu

Rząd Nunavut, terytorium w północnej Kanadzie, jako jeden z pierwszych partnerów przystąpił do programu. Mieszkańcy Nunavut posługują się językami Inuitów, takimi jak inuktitut i inuinnaqtun. Współpraca ta ma na celu integrację tych języków z modelami AI, co przyczyni się do ich zachowania i promocji w środowisku cyfrowym. ​

Benchmark tłumaczeniowy

W ramach programu Meta wprowadziła również otwartoźródłowy benchmark tłumaczeniowy, składający się z zdań starannie opracowanych przez ekspertów językowych. Benchmark ten, dostępny w siedmiu językach, ma na celu ocenę wydajności modeli tłumaczeniowych AI i zachęcenie społeczności do wnoszenia własnych tłumaczeń, co przyczyni się do stworzenia wszechstronnego narzędzia do oceny jakości tłumaczeń maszynowych.

Zaangażowanie w różnorodność językową

Meta od lat angażuje się w inicjatywy wspierające różnorodność językową. W 2022 roku firma uruchomiła projekt No Language Left Behind (NLLB), który był przełomowym krokiem w kierunku tworzenia modeli tłumaczeniowych dla wielu języków. Współpraca z UNESCO oraz platformą Hugging Face zaowocowała stworzeniem tłumacza opartego na NLLB, zaprezentowanego podczas Zgromadzenia Ogólnego ONZ we wrześniu 2024 roku.

Masaowo Wielojęzyczna Mowa (MMS)

Najnowszym osiągnięciem Meta jest projekt Massively Multilingual Speech (MMS), który rozszerza transkrypcję audio na ponad 1100 języków. W 2024 roku wprowadzono funkcję zero-shot speech recognition, umożliwiającą transkrypcję mowy w językach, które nie były wcześniej uwzględniane w treningu modeli.

Znaczenie programu

Inicjatywa Meta i UNESCO ma kluczowe znaczenie dla promocji różnorodności językowej i inkluzywności w świecie cyfrowym. Rozwój technologii AI wspierających języki niedostatecznie reprezentowane przyczynia się do ich zachowania i umożliwia ich użytkownikom pełniejsze uczestnictwo w globalnej komunikacji. Ponadto, otwartoźródłowy charakter tych technologii sprzyja współpracy i dalszemu rozwojowi w społeczności naukowej i technologicznej.​

Podsumowanie

Współpraca Meta z UNESCO w ramach Language Technology Partner Program stanowi istotny krok w kierunku bardziej inkluzywnego i różnorodnego językowo świata cyfrowego. Dzięki zaangażowaniu partnerów z różnych regionów i kultur, program ten ma potencjał, by znacząco wpłynąć na rozwój technologii tłumaczeniowych i rozpoznawania mowy, otwierając nowe możliwości dla społeczności posługujących się językami mniejszościowymi.