Przejdź do zawartości

Tłumacz Google: Różnice pomiędzy wersjami

Z Wikipedii, wolnej encyklopedii
[wersja przejrzana][wersja przejrzana]
Usunięta treść Dodana treść
poprawka listy i błędów gramatycznych
Linia 10: Linia 10:
| właściciel = [[Google]]
| właściciel = [[Google]]
| rejestracja = opcjonalna (po zalogowaniu się na konto [[Google]] tłumacz zapisuje historię wyszukiwań na koncie oraz pozwala na sprawdzanie tłumaczeń)
| rejestracja = opcjonalna (po zalogowaniu się na konto [[Google]] tłumacz zapisuje historię wyszukiwań na koncie oraz pozwala na sprawdzanie tłumaczeń)
| wersje językowe = 109 języki (w tym dwie odmiany chińskiego)
| wersje językowe = 109 języków (w tym dwie odmiany chińskiego)
| miejsce w Alexa.com =
| miejsce w Alexa.com =
| commons = Category:Google Translate
| commons = Category:Google Translate
Linia 91: Linia 91:
# [[język niemiecki|niemiecki]]
# [[język niemiecki|niemiecki]]
# [[język norweski|norweski]]
# [[język norweski|norweski]]
# [[język orija|orija]]
# [[język ormiański|ormiański]]
# [[język ormiański|ormiański]]
# [[język paszto|paszto]]
# [[język paszto|paszto]]
Linia 120: Linia 121:
# [[język turecki|turecki]]
# [[język turecki|turecki]]
# [[język turkmeński|turkmeński]]
# [[język turkmeński|turkmeński]]
# [[język ujgurski|ujgurski]]
# [[język ukraiński|ukraiński]]
# [[język ukraiński|ukraiński]]
# [[język urdu|urdu]]
# [[język urdu|urdu]]
# [[język ujgurski|ujgurski]]
# [[język uzbecki|uzbecki]]
# [[język uzbecki|uzbecki]]
# [[język walijski|walijski]]
# [[język walijski|walijski]]

Wersja z 10:21, 16 paź 2020

Tłumacz Google
Ilustracja
Komercyjna

nie

Data powstania

28 kwietnia 2006

Autor

Google

Właściciel

Google

Rejestracja

opcjonalna (po zalogowaniu się na konto Google tłumacz zapisuje historię wyszukiwań na koncie oraz pozwala na sprawdzanie tłumaczeń)

Wersje językowe

109 języków (w tym dwie odmiany chińskiego)

Strona internetowa

Tłumacz Google (ang. Google Translate) – darmowy serwis internetowy Google umożliwiający tłumaczenie tekstów, plików tekstowych, stron internetowych, mowy, zdjęć i wideo w czasie rzeczywistym na ponad 100 języków. W przypadku wpisania tekstu serwis tłumaczy go w czasie rzeczywistym (bez potrzeby klikania w przycisk „Tłumacz”). Po wpisaniu w okienko translatora pojedynczego słowa działa on jak słownik – podając zwykle kilka lub kilkanaście propozycji tłumaczenia. Codziennie z serwisu korzysta 200 milionów osób[1].

Aplikację można obsługiwać przy pomocy Google Translate API. Dostępna jest na telefony z systemem Android i iOS.

Języki

Obecnie dostępne jest 109 języków[2]:

Dodatkowo w Społeczności można wybrać dodatkowe 62 języki, aby wspierać je, lecz nie można jeszcze w nich tłumaczyć. Są to:

Metoda translacji

W kwietniu 2006 r. uruchomiono Tłumacz Google ze statycznym mechanizmem tłumaczenia maszynowego[3].

Działanie Tłumacza Google nie opiera się na stosowaniu prawideł gramatycznych – jego algorytmy są oparte na analizie statystycznej, a nie na tradycyjnej analizie wykorzystującej reguły. Oryginalny twórca systemu, Franz Josef Och, skrytykował skuteczność algorytmów opartych na regułach, zalecając stosowanie metod statystycznych. Aplikacja wykorzystuje metodę zwaną statystycznym tłumaczeniem maszynowym, opartą na badaniach Och, który wygrał konkurs DARPA na tłumaczenie maszynowe w 2003 roku. Och był szefem grupy tłumaczeń maszynowych Google, aż do momentu dołączenia do Human Longevity, Inc. w lipcu 2014 r.[4]

Według Och'a solidna podstawa do stworzenia użytecznego systemu statystycznego dla nowej pary języków od podstaw powinna składać się z dwujęzycznego korpusu tekstowego (lub kolekcji równoległej) o objętości ponad 150-200 milionów słów i dwóch jednojęzycznych korpusów, z których każdy powinien zawierać ponad miliarda słów. Modele statystyczne z tych danych są następnie wykorzystywane do tłumaczenia między językami.

Do zebrania tak ogromnej ilości danych językowych Google wykorzystał transkrypty Narodów Zjednoczonych i Parlamentu Europejskiego[5][6].

Tłumacz Google nie tłumaczy bezpośrednio z jednego języka na inny (L1 → L2). W większości przypadków treści są tłumaczone najpierw na angielski, a dopiero potem na język docelowy (L1 → EN → L2).

Przy generowaniu tłumaczenia Tłumacz Google szuka wzorców w setkach milionów dokumentów, aby znaleźć najtrafniejsze odwzorowanie. Dzięki mechanizmowi wykrywającemu wzorce w dokumentach, które zostały już przełożone przez prawdziwych tłumaczy, Tłumacz Google może inteligentnie domyślić się, jak powinno brzmieć poprawne tłumaczenie.

Przed październikiem 2007 r. tłumaczenia między językami innymi niż arabski, chiński i rosyjski działały w oparciu o SYSTRAN – silnik oprogramowania, który do tej pory jest stosowany w niektórych usługach tłumaczeniowych, takich jak Babel Fish (obecnie zamknięte). Od października 2007 r. Tłumacz Google używa zastrzeżonej technologii wewnętrznej opartej na statystycznym tłumaczeniu maszynowym[7][8].

GNMT

We wrześniu 2016 r. zespół badawczy Google pod kierownictwem inżyniera oprogramowania Harolda Gilchrista ogłosił opracowanie systemu GNMT (Google Neural Machine Translation) w celu zwiększenia płynności i dokładności Tłumacza Google[9][10], a w listopadzie ogłosił, że aplikacja przełączy się na GNMT.

System ten wykorzystuje dużą, sztuczną sieć neuronową zdolną do głębokiego uczenia się[11], a dokładniej długoterminowe sieci pamięci krótkoterminowych[12][13][14][15][16]. Dzięki wykorzystaniu metody tłumaczenia maszynowego opartą na próbkach (EBMT), w której system „uczy się z milionów przykładów”, GNMT pozwala poprawić jakość tłumaczenia[12]. Technika ta umożliwia przekładanie „całych zdań naraz, a nie kawałek po kawałku. Zwraca uwagę na szerszy kontekst, aby znaleźć najbardziej odpowiednie tłumaczenia, które następnie przestawia i dostosowuje tak, aby przypominały ludzką mowę i używały właściwej gramatyki”. Zaproponowana przez GNMT architektura została po raz pierwszy przetestowana na ponad stu językach obsługiwanych przez Tłumacza Google. Dzięki kompleksowej strukturze „system z czasem uczy się tworzyć lepsze, bardziej naturalne tłumaczenia”. Sieć GNMT jest zdolna do tłumaczenia maszynowego międzyjęzykowego, która koduje „semantykę zdania, a nie po prostu zapamiętuje frazę do tłumaczenia”, a system nie wymyślił własnego uniwersalnego języka, ale używa „części wspólnej znalezionej w wielu językach”[17]. GNMT został po raz pierwszy włączony dla ośmiu języków: angielskiego, chińskiego, francuskiego, niemieckiego, japońskiego, koreańskiego, portugalskiego, hiszpańskiego i tureckiego[18]. W marcu 2017 r. udostępniono języki hindi, rosyjski, polski[19] i wietnamski[20], a następnie języki indonezyjski, bengalski, gudżarati, kannada, malajalam, marathi, pendżabski. Obecnie wszystkie języki z 109 są obsługiwane przez GNMT, z wyjątkiem łacińskiego.

GNMT daje możliwość tłumaczenia bezpośrednio z jednego języka na inny (L1 → L2), co jest poprawą w stosunku do wcześniejszych wersji Tłumacza Google, które najpierw tłumaczyły na język angielski, a dopiero potem na język docelowy (L1 → EN → L2). System GNMT ma również możliwość tłumaczenia Zero-Shot – tłumaczenia pomiędzy parą języków (na przykład z japońskiego na koreański), z którą „system nie miał wcześniej do czynienia”[21].

Krytyka i wykorzystanie w praktyce

Tuż po wystartowaniu serwisu, wygrał on międzynarodowy turniej w tłumaczeniu maszynowym z angielskiego na chiński i arabski[22].

Błędy, nieprawidłowości oraz easter eggi

Ze względu na statystyczny charakter poprzedniego systemu, tłumaczenia często zawierały bezsensowne i nierzadko oczywiste błędy[23], czasami zamieniając pewne wyrażenia na podobne, lecz różne semantycznie[24] bądź nawet odwracając znaczenie zdań. Obecnie ilość nieprawidłowości jest o wiele mniejsza, jednak nadal można je spotkać, szczególnie w nowszych językach. Strony typu Bad Translator czy Translation Party wykorzystały serwis, tłumacząc wielokrotnie zdania dla humorystycznego efektu, podobnie jak w grze w głuchy telefon[25].

Przy wpisaniu "najzabawniejszego dowcipu świata" i przetłumaczeniu z niemieckiego na angielski wyskakuje wiadomość "[FATAL ERROR]"[26].

Od listopada 2015 r. do lutego 2016 r. była dostępna opcja "Aurebesh", która zmieniała litery języka angielskiego na te owego pisma.

Wykorzystanie w sądzie

W 2017 r. Tłumacz Google został użyty podczas rozprawy sądowej w Teesside Magistrates' Court, ponieważ nie można było zarezerwować interpretatora dla oskarżonego mówiącego po chińsku[27].

Przypisy

  1. Stephen Shankland: Google Translate now serves 200 million people daily. [dostęp 2016-10-13].
  2. dane z 10 października 2020 r.
  3. Statistical machine translation live, „Research Blog” [dostęp 2018-05-01] (ang.).
  4. Franz Och, Ph.D., Expert in Machine Learning and Machine Translation, Joins Human Longevity, Inc. as Chief Data Scientist – Human Longevity, Inc. [online], www.humanlongevity.com [dostęp 2018-05-01] (ang.).
  5. Tim Adams, Google Translate and the battle for accurate translations by computer [online], the Guardian, 19 grudnia 2010 [dostęp 2018-05-01] (ang.).
  6. Adam Tanner, Google seeks world of instant translations, „U.S.” [dostęp 2018-05-01] (ang.).
  7. Google Switches to Its Own Translation System, „Google Operating System” [dostęp 2018-05-01].
  8. Google Translate Drops Systran For Home Brewed Translation – Search Engine Land, „Search Engine Land”, 23 października 2007 [dostęp 2018-05-01] (ang.).
  9. Found in translation: More accurate, fluent sentences in Google Translate, „Google”, 15 listopada 2016 [dostęp 2018-05-01] (ang.).
  10. A Neural Network for Machine Translation, at Production Scale, „Research Blog” [dostęp 2018-05-01] (ang.).
  11. Zero-Shot Translation with Google’s Multilingual Neural Machine Translation System, „Research Blog” [dostęp 2018-05-01] (ang.).
  12. a b Tłumacz Google z neuronowym silnikiem – by chińszczyznę było łatwiej pojąć, „dobreprogramy.pl”, 29 września 2016 [dostęp 2017-10-17] (pol.).
  13. Sepp Hochreiter, Jürgen Schmidhuber, Long Short-term Memory, „Neural computation”, 9, 1997, s. 1735–80, DOI10.1162/neco.1997.9.8.1735 [dostęp 2018-05-01].
  14. Felix A. Gers, Jürgen Schmidhuber, Fred Cummins, Learning to Forget: Continual Prediction with LSTM, „NEURAL COMPUTATION”, 12, 1999, s. 2451––2471 [dostęp 2018-05-01].
  15. Yonghui Wu i inni, Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation, „arXiv:1609.08144 [cs]”, 26 września 2016, arXiv:1609.08144 [dostęp 2018-05-01].
  16. An Infusion of AI Makes Google Translate More Powerful Than Ever, „WIRED” [dostęp 2018-05-01] (ang.).
  17. Chris McDonald, Ok slow down. [online], Chris McDonald, 7 stycznia 2017 [dostęp 2018-05-01].
  18. A Neural Network for Machine Translation, at Production Scale, „Research Blog” [dostęp 2018-05-01] (ang.).
  19. Tłumacz Google z lepszą obsługą polskiego dzięki sieciom neuronowym, „dobreprogramy.pl”, 21 marca 2017 [dostęp 2017-10-17] (pol.).
  20. Google Translate now uses neural machine translation for some languages, „Android Police”, 6 marca 2017 [dostęp 2018-05-01] (ang.).
  21. Zero-Shot Translation with Google’s Multilingual Neural Machine Translation System, „Research Blog” [dostęp 2018-05-01] (ang.).
  22. Michael A Nielsen, Reinventing discovery : the new era of networked science, Princeton, N.J.: Princeton University Press, 2012, ISBN 978-0-691-14890-8, OCLC 724663975 [dostęp 2020-10-10].
  23. Google Translate Tangles With Computer Learning [online], www.forbes.com [dostęp 2020-10-10].
  24. Google Translates Ivan the Terrible as “Abraham Lincoln” » InsideGoogle » part of the Blog News Channel [online], web.archive.org, 12 września 2007 [dostęp 2020-10-10] [zarchiwizowane z adresu 2007-09-12].
  25. Translation Party: Tapping Into Google Translate's Untold Creative Genius [online], TechCrunch [dostęp 2020-10-10] (ang.).
  26. Christopher L. Freeze na Instagramie: „#JokeWarfare #MontyPython @google” [online], Instagram [dostęp 2020-10-10] (pol.).
  27. Kieran Corcoran, A British court was forced to rely on Google Translate because it had no interpreter [online], Business Insider [dostęp 2020-10-10].