メディア統括本部 サービスリライアビリティグループ(SRG)の石川雲(@ishikawa_kumo)です。 #SRG(Service Reliability Group)は、主に弊社メディアサービスのインフラ周りを横断的にサポートしており、既存サービスの改善や新規立ち上げ、OSS貢献などを行っているグループです。 本記
近年ではオンラインの翻訳サービスに機械学習が用いられるようになり、以前よりも格段に翻訳の精度が向上しています。2017年8月にサービスが開始された機械学習を用いたオンライン翻訳サービスの「DeepL翻訳」が、日本語と中国語の翻訳に新しく対応したとのことで、実際に日本語での翻訳機能を試してみました。 DeepL翻訳 https://www.deepl.com/translator DeepL翻訳が日本語と中国語を習得 https://www.deepl.com/blog/20200319.html DeepL Translator gets support for Japanese and Chinese languages - gHacks Tech News https://www.ghacks.net/2020/03/19/deepl-translator-gets-support-f
Google翻訳がニューラルネットワーク応用で「さらに進化」。翻訳ソフト感うすれ、流暢さを身につける - Engadget 日本版にもあるように、新しいNMTのGoogle翻訳はこれまでの機械翻訳とは段違いの性能で評判だ。わたしも少しずつ使ってみたりしていたのだが実際に職務でインパクトがあったのでここに記録しておこうと思う。 ご存知の方もいると思うが、わたしはApache Mesosを使ったソフトウェアの開発を仕事にしている。これは単体のサーバーでも動作するので、開発するときはほとんど1台または2台くらいのサーバーを使っている。しかしながら、実際の環境ではもっと多くのサーバーがクラスタとなって動作する。当然、複数のサーバーで動作するときしかでない問題は多い。詳しくは省略するが、今回もその件に漏れず複数サーバーないと出ない問題に当たって、それ自体はMesosの仕様を見逃していたせいなので修正
新しいGoogle翻訳がニューラルネットワークに基づく機械翻訳に移行して品質が向上した、というので早速使ってみました。 翻訳対象はHadoopのFair Schedulerに関するドキュメントです。 Fair Schedulerは、Capacity Schedulerと並ぶHadoopの2つのスケジューラの一つですが、挙動が少し複雑で、理解するのに苦労します。ドキュメント自体も長く、英語に不慣れな人には読むのがなかなか大変な文書で、前々から訳したいとは思っていました。しかし、3700ワード(A4に文字ぎっしりで7ページ近く)の技術文書を訳すとなると、かなりの労力が必要になります。少なくとも一日仕事になるのは間違いありません。私も仕事が忙しく、なかなか翻訳の時間がとれなかったため、翻訳作業はタスクキューの底に埋もれてしまっていました。 そこで、今回新しい翻訳がどれほどのものか試すのも兼ねて、
社内の機械学習勉強会で最近話題になった機械学習関連のエントリを取り上げているのですが、ここ一ヶ月ではGoogle Neural Machine Translation(GNMT)がとても話題になっていました。GNMTで使われているEncoder-Decoderやattentionのような仕組みを直近で使う予定は特にはないですが、機械学習を使うエンジニアとして知っておいて損はないし、技術的に何が変わったことにより何ができるようになって、何はまだできないのかを知ろう、というのが目的です。技術的な項目は興味ない人も多そうなので、最後に持っていきました。 Google Neural Machine Translation(GNMT)の最近の進化について できるようになったこと 定量的な評価 まだまだ難しいこと 技術的な詳細 Encoder-decoder Attention based encod
メディア関係者向けお問い合わせ先 メールでのお問い合わせ: pr-jp@google.com メディア関係者以外からのお問い合わせにはお答えいたしかねます。 その他すべてのお問い合わせにつきましては、ヘルプセンターをご覧ください。
対訳表を作るのが面倒 システム設計をする時に、データベース名や変数名や表示名などを決めるのが面倒だ。一般的には英字文字列で作るのだけど、ローマ字で「kokyaku」とか付けるのはダサいし、いちいち辞書を引いていくのは億劫。 多言語対応のために表示名をフランス語にするみたいな要件もでてくるが、これらの作業の下準備を実現する手段として、Google Docsのスプレッドシート(表計算ソフト)の翻訳関数を利用する方法が考えられる。 =IF($A2<>"", GOOGLETRANSLATE($A2,"ja","en"),"") 指定セルの内容を翻訳するには「GOOGLETRANSLATE(値,ソース言語,ターゲット言語)」関数を入力する。例えばセルの計算式に上記式を入力すると「A2セルの内容がある場合にA2セルの値を日本語から英語に翻訳する」という意味になる。 スプレッドシートで多言語対訳表を作る
以下の文章は、Robert Graham による Pin-pointing China's attack against GitHub の日本語訳であり、著者の許可を得て公開するものである。 この一週間(訳注:原文は2015年4月1日に公開された)、「GitHub」というウェブサイトが中国による攻撃にさらされた。この投稿では、http-traceroute を行うことでその攻撃がどこから来てるかを特定する。 GitHub はインターネットの重要基盤をなすウェブサイトで、オープンソースプロジェクトの最大のホスト先だが、最も有名なのは Linux である(私のコードもそこでホストしている)。GitHub はまた、人気のブログプラットフォームでもある。 数え切れないほどホストしているプロジェクトの中に、https://github.com/greatfire や https://github.c
2015年2月20日に読売新聞が報じた翻訳サイトに関わる騒動についてまとめます。 注意喚起 翻訳サイトでの翻訳結果に関する注意喚起 - contrail IPA プレス発表 【注意喚起】クラウドサービスに入力した内容の意図しない情報漏えいに注意 タイムライン 日時 出来事 2015年1月15日 contrail045氏が翻訳サイトを通じてメール情報が表示される件を注意喚起 2015年2月20日 読売新聞が記事を掲載。 〃 IPAが翻訳サイト利用に関する注意喚起を掲載。 公開されていた翻訳結果の内容 メールを翻訳したと思われるものが多く、次のような内容が確認されていると報道。 総務省職員と電機大手とのセミナーの打合せ*1 中央省庁、銀行、メーカーのやり取り 採用情報に関するやり取り 給与情報 不倫の示談に関するやり取り*2 騒動まとめ 翻訳サイトの騒動をまとめると次の通り。 翻訳結果が保存さ
書籍「ソフトを他人に作らせる日本、自分で作る米国」を読んでいたところ、元日本IBMの方によるタイトルの発言が飛び出した。この業界に長くいると、仮想記憶に仮想計算機と「仮想」という訳語にはまったく違和感を感じなくなってしまったが。。。曰く、IBMがVirtual memoryを発表したとき(MVSのことかな*1)、日本IBMが仮想記憶と訳したのだそうな。『virtualは「事実上の」「実質的」という意味であり、virtual memoryは「本来のメモリーではないが事実上メモリーとして使える技術」を意味する。』 大学時代の恩師も次のように言っていた。 「仮想」という概念が、コンピュータの世界に入ったのは、19751965年のことである。MITがMULTICSという汎用大型TSSの構想を発表した。これが現在の、パソコンネットワーク時代の幕開けの狼煙であった。この中の技術に「仮想記憶」の概念が含
Paul Krugman, “Missing: A Massive ‘Skills Gap,’” Krugman & Co., September 12, 2014. [“The Beveridge That Refreshes,” September 5, 2014; “Simply Unacceptable,” September 5, 2014.] 探しています:大量の「技能ギャップ」とやらはどこにある? by ポール・クルーグマン John W. Adkisson/The New York Times Syndicate アメリカには大量の「技能ギャップ」がある,って主張がある.失業の多くは構造的なもので,ここに反映しているのは不適切な就労準備をしてしまっている労働力とかなんとかだ,なんて主張する人たちがいる.こうした主張の拠り所となっているのは,「空席になっている仕事ならたくさん
Sinatraの日本語ドキュメント 私は以前の記事で、軽量なWEBサイト構築DSLであるSinatraプロジェクトにおけるドキュメントの日本語版作成が滞っていたので、私がそれを一歩進めたら彼に愛されたということを書きました。 英語圏のオープンソースプロジェクトに貢献する最も簡単な方法またはsinatra/README.jp.mdまたは彼はなぜ私を愛するようになったか その後、このプロジェクトでは複数の日本語を扱える方たちがそのメンテナンスを継続下さっていて、オリジナルドキュメントの更新がマージされると速やかに日本語版の更新が作成され、またときとして、その更新版に間違いが見つかると別の方がこれを指摘または修正する、という理想的な環境になっています。私のケアレスなミスも随分と直して頂きました。 Jekyllの日本語ドキュメント ところで、このブログの構築にも利用しているJekyllという静的サ
はじめに Redisの開発者である@antirezが一昨日投稿したブログポストにとても共感したので翻訳しました。 English has been my pain for 15 years - <antirez> 世界一わかりやすい英文法の授業 作者: 関正生出版社/メーカー: 中経出版発売日: 2008/02メディア: 単行本購入: 14人 クリック: 99回この商品を含むブログ (31件) を見る 僕が@antirezの文章を翻訳するのは今回が初めてではありません。RedisのドキュメントをまだRedisがバージョン2.0になったばかりの頃に日本語訳したのが最初でした。Redisドキュメント日本語化をしていた当時は翻訳しながら「ドキュメントが整っているなぁ」と感じたと同時に「独特の英語を使うなあ」という印象を受けました。その当時は彼が英語に苦労していた過去のことなど知らなかったので、こ
「ウェブリブログ」は 2023年1月31日 をもちましてサービス提供を終了いたしました。 2004年3月のサービス開始より19年近くもの間、沢山の皆さまにご愛用いただきましたことを心よりお礼申し上げます。今後とも、BIGLOBEをご愛顧賜りますよう、よろしくお願い申し上げます。 ※引っ越し先ブログへのリダイレクトサービスは2024年1月31日で終了いたしました。 BIGLOBEのサービス一覧
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く