タグ

解析に関するkssmのブックマーク (4)

  • RとRubyによるデータ解析環境を手っ取り早く構築してデータ解析するまで - snowlongの日記

    RとRubyによるデータ解析入門買いました。 データマイニングとかいま流行ってて面白そうだなー、でもどこからはじめればいいのかなーって前々から思っていたんです。 そんなところにRとRubyを使ってデータ分析のやり方をいちから教えてくれるが出たなら買うしかないですよね。 コマンド叩くだけでデータ解析が簡単にできちゃって、無意識のうちにニヤニヤしてしまい我ながら気持ち悪い毎日を過ごしています。 このの素晴らしい点はRとRubyの環境を用意さえすれば、コマンドを実行するだけでデータ解析ができちゃう!!(気分にさせてくれる)ところです。 プログラミングや統計の知識がなくても大丈夫、あとでわからないところは勉強すればいいんです。 簡単にデータを生成&分析して、結果を視覚的に確認できるところがすごくいいなと思いました。 というわけで、手元のMacLinuxが動くマシンを使って、データマイニングを

    RとRubyによるデータ解析環境を手っ取り早く構築してデータ解析するまで - snowlongの日記
    kssm
    kssm 2013/07/30
  • Treasure Data Analytics 第2回 〜Treasure Data Cloud Warehouse について(後編)〜 - doryokujin's blog

    はじめに Treasure Data Cloud Warehouse(前編)では,サービスの概観を紹介しました。第2回では,実践的なデータ・アナリティクスを行う上で解決しなければならない問題をTreasure Dataではどのように解決しているのか,具体的に述べていきたいと思います: データ収集の問題:様々な種類のログをどのようにデータを集約・収集して,横断的な解析を可能にするか? ストレージの問題:増え続けていく大量のログを,どこに,どのようなフォーマットで,解析可能な状態のまま保管していくか? 解析結果の活用に関する問題:ログを解析した結果を,どのように可視化するか。あるいはどのように既存のシステムに統合・フィードバックしていくのか? 1. データ収集の問題 図1: fluentd はログ解析の前段,ログ収集における問題を解決してくれる 「解析対象のログを収集してくる」という作業は

    Treasure Data Analytics 第2回 〜Treasure Data Cloud Warehouse について(後編)〜 - doryokujin's blog
  • ログ収集基盤のFluentdとFlume NG、どちらが使いやすい?

    ログは、システムの障害解析(デバッグ)や運用モニタリングに使うことを想定して、コンピュータに発生したイベントの履歴を時系列に沿ってファイルに出力したものである。有用なデータではあるが、扱いにくい面がある。そのため、複数のログを突き合わせて分析するといった活用が難しく、従来はもっぱら一つのログを単独で利用するにとどまるケースが多かった。 扱いにくい面とは、例えば「ログを一括して処理するには対象ログを各サーバーから収集しなければならない」「ログはサイズが大きくなりがちなので収集する場合は一部を抜き出すなどの加工が必要」といったことである。ログに新たなデータが書き込まれた際に、それを即座に取り出す手段が用意されていないこともそうだ。 こうしたログの扱いにくさは、「ログ収集基盤」と呼ばれるソフトウエアを使うことで克服可能である。ログ収集基盤は、複数のログを結び付けて分析する際などに必要な、対象ログ

    ログ収集基盤のFluentdとFlume NG、どちらが使いやすい?
  • Google Analyticsでサイトのことが丸分かりのバブルチャートをフル活用する方法 | nanapi [ナナピ]

    バブルチャート使っていますか? 「Google アナリティクスの中で最もサイト改善のヒントを見つけやすいグラフはどれか?」と聞かれたら間違いなく「バブルチャート」と答える筆者です。こんにちは。 しかし、Googleアナリティクスの解説や機能紹介を行っているサイトでなかなかお目にかかりません。そもそも「バブルチャートってGoogle アナリティクスで見られるの?」と思っている方も多いかもしれません。ぜひ、この記事を読んでいただき、その魅力に取り付かれてください! Googleアナリティクスの画面を確認する前に、「バブルチャート」とは何かを確認しておきましょう。 そもそもバブルチャートとは? 以下が、バブルチャートの画像になります。Excelなどでも用意されているグラフの1種で、3つの変数をひとつの図で表現できることが出来るのが特徴です。 X軸で1つの変数、Y軸で1つの変数、円の大きさで1つの

  • 1