[B! mahout] beth321のブックマーク

beth321 id:beth321

mahoutに関するbeth321のブックマーク (7)

Mahoutで体感する機械学習の実践記事一覧 | gihyo.jp
- 94 users
- gihyo.jp
- 学び
第2回「ある商品といっしょによく売れる商品は何か？」を見つけるには　～マーケット・バスケット分析の考え方やまかつ 2013-03-06
beth321 2014/10/08
レコメンデーション

mahout

機械学習

開発

データマイニング

machinelearning

machine learning

Hadoop

分析

ビッグデータ
リンク
Mahoutイン・アクション
Sean Owen, Robin Anil, Ted Dunning, Ellen Friedman　著、伊東直子、真鍋加奈子、堀内孝彦、都元ダイスケ　訳 TOPICS Programming , Database 発行年月日 2012年10月 PRINT LENGTH 448 ISBN 978-4-87311-584-9 原書 Mahout in Action FORMAT PDF Apacheプロジェクトが提供するオープンソースの機械学習ライブラリ、Mahoutについて包括的に解説する書籍です。協調フィルタリングによるレコメンデーションについて、オンメモリ実装からHadoopベースの並列実装までを説明することで、分散環境における機械学習アルゴリズムの全体像を明らかにします。また、データの中で似た者同士をクラスタにグループ化するクラスタリングアルゴリズムに触れ、さらに分類器の構築
beth321 2014/09/22
japan

本

ebook

mahout

book

機械学習

hadoop

O'Reilly

machineLearning

Apache
リンク
第1回　機械学習を実践する前の基礎知識 | gihyo.jp
みなさん、次のようなことができたらいいと思ったことはありませんか？「顧客ごとに、適したタイミングと内容で、DMを送信できたら……」「CGM系サイトへの誹謗中傷なんかのスパム投稿を自動識別できたら……」「サーバの負荷が高まるタイミングを事前に予測できたら……」一見するとこれらは実現していることがまったく異なりますが、じつはある共通点があります。それは「データを分析し、その結果を活用している」という点です。 Data is Kingの考えから得られるメリットかつてAmazonに在籍していたRonny Kohaviは「Data is King at Amazon」と言い、データの重要性を説きました。事実、Amazonはユーザの購買履歴から商品のレコメンデーションを行い、ユーザのサイト内の遷移履歴やクリック率からサイト構造の改善を行うなど、データを徹底的に活用していることで知られています
beth321 2014/09/16
機械学習

データマイニング

datamining

統計

machine learning

プログラミング

mahout

あとで読む

データ分析

programming
リンク
電子書籍『実践機械学習』の無料ダウンロードが可能に！
機械学習の基礎について解説した電子書籍『実践機械学習 ― レコメンデーションにおけるイノベーション』がHadoop情報サイト「Hadoop Times」から無料でダウンロードできます。著者は『Mahoutイン・アクション』の著作でもお馴染みのTed DunningとEllen Friedman。Apache Mahoutプロジェクトでプロジェクトマネジメント委員やコミッタとして活躍しながら、MapR社でチーフアプリケーションアーキテクトやコンサルタントを務めている両氏が、機械学習の初学者のために書き下ろしたの一冊です。50ページほどの手軽なボリュームながら、レコメンデーションを洗練させるための重要なエッセンスが詰まっています。機械学習とレコメンデーションについて学習したいけれど、どこから始めればよいか迷っているという方は、手始めに本書を読むところから始めてみてはいかがでしょうか。 H
beth321 2014/09/09
書籍

機械学習

電子書籍

oreilly

hadoop

ebook

mahout

ダウンロード

本

book
リンク
Apache Mahoutの使い方：テキスト分類のアルゴリズムを活用する
ビッグデータ活用：その分析実装として注目されるMahout 長年蓄積した企業内データや、ソーシャルネットワークサービス、センサ端末から集められる膨大なデータを活用し、企業における利益向上やコスト削減などに活用する動きが活発になってきました。データの分析手段として最近とみに注目されている技術として「機械学習」があります。大規模データの処理を得意とする大規模分散処理基盤「Apache Hadoop」の強みを生かし、簡単に機械学習を行うためのライブラリが、「Apache Mahout」（以下、Mahout）です。本稿ではMahoutを用いたデータ分析の例として「文書分類」を取り上げます。マシンを用いて分析実行する際の手順や陥りがちなポイント、チューニング方法の一例を紹介します。 Mahoutとは？ MahoutとはApache Software Foundationが公開しているOSSの機械
beth321 2014/03/04
machinelearning

*あとで読む

機械学習

mahout

apache

hadoop

programming

テキストマイニング
リンク
MapReduceできる10個のアルゴリズム - データサイエンティスト上がりのDX参謀・起業家
HadoopとMahoutにより、ビッグデータでも機械学習を行うことができます。Mahoutで実装されている手法は、全て分散処理できるアルゴリズムということになります。Mahoutで実装されているアルゴリズムは、ここに列挙されています。論文としても、2006年に「Map-Reduce for Machine Learning on Multicore」としていくつかのアルゴリズムが紹介されています。そこで今回は、（何番煎じか分かりませんが自分の理解のためにも）この論文で紹介されているアルゴリズムと、どうやって分散処理するのかを簡単にメモしておきたいと思います。計算するべき統計量が、summation form（足し算で表現できる形）になっているかどうかが、重要なポイントです。なってない場合は、”うまく”MapReduceの形にバラす必要があります。 ※例によって、間違いがあった場合は随時
beth321 2012/05/28
2006年

*あとで読む

mapreduce

hadoop

アルゴリズム

Machine Learning

mahout

論文

analysis

algorithm
リンク
試すのが難しい―機械学習の常識はMahoutで変わる
ビッグデータ時代―なぜ、いま機械学習なのか Apache Hadoop（以下、Hadoop）の登場で、今まで捨てていたデータ、貯めるだけで処理しきれなかったデータを活用できるようになりました。活用手段として最近とみに注目されている技術が「機械学習」であり、Hadoopの強みを生かし簡単に機械学習を行うためのライブラリが、「Apache Mahout」（以下、Mahout）です。本稿ではMahoutを動かしてみることで、機械学習の常識を身に付けます。そもそも、機械学習とは？機械学習とは、一定のデータをコンピュータ・プログラムに「学習」させ（すなわち、そのデータに潜むパターンや規則性を表す「モデル」を自動的に構築させ）、他のデータにそのモデルを適用すれば、あたかも人間のように複雑で柔軟な判断が行えるようにするという試みです。機械学習をビジネスに活用した例は、レコメンド（ユーザーや商品
beth321 2012/03/08
Apache

*あとで読む

hadoop

Mahout

機械学習

machine learning

ビッグデータ

Java

Apache Mahout

学習
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx