
Fot. East News / Shutterstock
Wyniki badań amerykańskich naukowców wskazują, że j
ęzyk polski
, mimo swojej trudności gramatycznej, jest
najlepszym językiem do pracy z AI
. W badaniu
"One ruler to measure them all: Benchmarking multilingual long-context language models
", przeprowadzonego przez zespół naukowców z University of Maryland oraz Microsoftu, język polski zajął pierwsze miejsce pod kątem
wydajności
sztucznej inteligencji w
formułowaniu promptów
o długim kontekście.
Badanie miało charakter porównawczy. Naukowcy przeprowadzili test, w którym sprawdzili wydajność promptowania
w 26 różnych językach
dla modeli: OpenAI o3-mini-high, Google Gemini 1.5 Flash, Qwen2.5 (7B i 72B), Llama 3.1 (8B), Llama 3.3 (70B) oraz DeepSeek-R1.
"Eksperymenty z otwartymi i zamkniętymi modelami LLM ujawniają rosnącą różnicę w wydajności między językami o niskich i wysokich zasobach, wraz ze wzrostem długości kontekstu z 8 tys. do 128 tys. tokenów" - czytamy w raporcie.
Przeprowadzony eksperyment wyłonił ranking najbardziej wydajnych języków w konteście promptowania sztucznej inteligencji. Pierwsze miejsce zajął
język polski
, osiągając wynik
88%
skuteczności. Na podium uplasował się również
język francuski z wynikiem 87% oraz włoski zdobywając 86%
wydajności w promptowaniu. Co ciekawe,
język angielski
, który dominuje w kontekście trenowania sztucznej inteligencji zajął dopiero
6 miejsce
, z wynikiem skuteczności
83.9%
.
"Co zaskakujące, język angielski nie jest językiem o najwyższej wydajności w zadaniach długiego kontekstu (zajął 6. miejsce na 26), a na szczyt listy wysuwa się język polski" - informują badacze.
Układ badania zawierał siedem zadań podzielonych na dwie kategorie:
wyszukiwanie
(zadania, w których poszukuje się informacji, która nie istnieje w tekście) oraz
agregacja
(ekstrakcja najczęściej występujących słów z długiej listy). Okazuje się, że najlepiej z zadaniami poradził sobie język polski, mimo "stosunkowo niewielkiej ilości zasobów", które służą do trenowania LLM-ów.
Dodatkowo, wysoki wynik osiągnęły również języki: hiszpański (85%), rosyjski (84%), ukraiński (83.5%), portugalski (82%), niemiecki (81%) oraz holenderski (80%).