2018/11/20開催の「Machine Learning Casual Talks #7」での発表資料です。 チームで開発中の、サイエンティストとエンジニアが効率よく 機械学習や分析結果をプロダクトへ反映するための基盤の紹介です。 https://mlct.connpass.com/event/104874/Read less
4. 4 現在急速に進化している2つの技術 • 統計的機械学習 – 過去データの統計的パターンを用いて将来を予測する技術 • 例1.Google: 大量の猫画像で訓練し、「これは猫か」を判別させる • 例2.Amazon:「これを買った人はあれも買っています」 – 基本的に統計 • 未来が過去の繰り返しでないと無力 • 異常事態には対応できない、臨機応変な対応はできない • 数理最適化 – 所与のルールの下で、所与の目的関数を最大化する打ち手を探索する技術 • 例1.カーナビ: 「最短時間で目的地に着く」 • 例2.AlphaGo Zero :「ゲームに勝つ」 – ルール・目的関数が不完全だと、不適切な解が見つかることもある • 人:「コーヒーをとってきて」 • ロボット: スタバへ行き、列に並んでいる他の客を殺してコーヒーをとってくる – 目的達成の意味では正しいが… 「やって欲しくない
子どもに言葉を教える際、誰も主語と動詞の違いや、それらが文章中のどこに置かれるのかをわざわざ説明したりはしない。しかし、コンピュータに言語を理解させようとした場合には話が違ってくる。われわれは、文の構造や単語の意味を描写するための注釈を付加し、それらの文を使ってシンタックス(構文)パーサ(解析器)とセマンティック(意味)パーサを訓練することになる。この種のパーサはAmazonの「Alexa」のような音声認識システムに自然言語を理解させようとする場合に役立つが、その訓練は時間のかかるプロセスであり、あまり一般的でない言語の場合には、特に難しいものとなる。 米国時間10月31日、マサチューセッツ工科大学(MIT)の研究者らは、パーサの新しい訓練方法に関する研究論文を発表した。彼らが作成したシステムは、子どもの学習方法をまねながら、説明の付加された動画を読み込み、そこに映っている行動や物体との関
R&D部部長の 榊 です。今日は、当社におけるデータサイエンティストの定義と求められるべきスキルセットについて話したいと思います。 概要 下図のように当社における「データ分析を活用したSaasを開発する場合のデータサイエンティストの定義」を作りました。 既存の3つの定義から、良い部分を拝借しました。 各社ごとに、自社にあったデータサイエンティストを定義しておくのが重要ではないか? はじめに 当社は、「データとAIで意思決定をサポートする」を事業ミッションとして掲げており、特に去年から人工知能技術 (※) に長じた人材、言い方を変えればデータサイエンティストの採用と育成に力を入れてきました。しかし、特に社内で「データサイエンティストとは何か」の定義などを作ることもなく、当社に必要な人材のスキルを列挙し、そちらを募集要項に書くことで満足していました。 そんな中で、某強面の役員から、ある日 「そ
ここ数年のDeep Learningの発展は目覚ましく、急速に実用化が進んでいます。タスクによっては人間に匹敵する精度に達しているものもあり、システムの一部品としてデプロイする場面も増えてくると思います。そこで問題になるのが計算機資源の制約です。学習時には大量の学習データを用意し、GPUなどの計算資源で数時間や数日かかるような学習をしますが、推論時には限られたメモリや計算資源のもとで動作させる必要があります。リアルタイムに大量の入力データを捌く必要があったり、スマートフォンやエッジデバイスなどで動作させる場合には、この制約はさらに強くなります。 深くて大きいモデルの方が精度が出るが、実用を考えると軽量なモデルにする必要がある。こういった場面で最近よく使われる手法として、 知識の蒸留 (Knowledge Distillation) と呼ばれる方法があります。これは、(典型的には)大きくて複
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く