機械翻訳とは、自然言語(人間が自然に取得した言語体系)を、コンピュータプログラムを用いて、他の言語に翻訳することである。
概要
現在、様々なポータルサイトには、母国語(L1)から他の言語(L2)への、コンピュータを用いた機械翻訳が存在する。また、機械翻訳ソフトは様々なソフトが市販されている。
しかしながら、機械翻訳の技術はまだ未熟であり、定形型の文章(書き言葉)には、機械翻訳に翻訳をしたい文章を入力すると、比較的、良い翻訳が出力されるが、不定型の文章(話し言葉)を入力すると、かなり間違った翻訳された文章が出力される。 これはL1→L2の機械翻訳でもL2→L1の機械翻訳でも、同じ事である。現在の機械翻訳の精度は、せいぜい50%程度だが、翻訳したい文章を短くする、などの工夫で翻訳精度が上がる。
反復翻訳ベンチマークテストとは
機械翻訳アルゴリズムの精度を測定する方法として、「反復翻訳ベンチマークテスト」というものがある。これは、L1→L2への機械翻訳による出力された文章(第一次翻訳)をそのまま、同じ機械翻訳エンジンにおいて、更にL2→L1に翻訳し(第二次翻訳)、その出力された文章の結果が、どれだけ第一翻訳に用いた「原型の文章」を保てているか、ということで、機械翻訳アルゴリズムの精度が測定できる。
「反復翻訳ベンチマークテスト」の結果は、最初に入力した文章が短く、文法的に簡単であればあるほど、テストの結果は向上するが、実際の自然言語において、反復翻訳ベンチマークテストを行うと、第四次~第六次反復を終了した時点で、最初に入力した文章(原形文章)の形は、ほとんど原形を保っておらず、文法的にも意味的にも、言語としての条件を満たさない状態になっていることがほとんどである。
反復ベンチマークテストを利用した遊び動画について
様々な動画において、反復翻訳を利用して、動画などに第二次翻訳(L1→L2→L1の反復翻訳)をアフレコする、という試みが行われ、非常に前衛的な動画に仕上がっており、翻訳エンジンの精度の低さにより、結果的に非常に面白い動画が完成されている。
歴史
コンピューターが出て間もないころから機械翻訳は試みられていて、1947年にウォーレン・ウィーヴァーが英語からフランス語への翻訳を機械で行おうとしている。1954年にはジョージタウン大学とIBMがロシア語から英語への機械翻訳の実演を行なっている。その後機械翻訳の研究は各地で行われ、日本でも1955年に九州大学と電気試験所が機械翻訳を行っている。しかし1966年にアメリカで提出されたALPACの報告書で機械翻訳は当分できないという報告がされ、アメリカでは研究予算が大幅に減額され研究が下火となった。
1980年代に入ってコンピュータの処理能力が増し、大量データを用いる統計的なアプローチが有効になっていきより高度な翻訳ができるようになっていった。日本では1982年に科学技術庁による機械翻訳システムの研究プロジェクトが開始している。1990年代になると音声認識、音声合成の分野に進歩があり、会話の翻訳の研究が始まった。またコンピュータの価格低下、高機能化、一般への普及が進みパソコンでも機械翻訳ができるようになった。
関連動画
関連項目
機械翻訳サービス
- 7
- 0pt