第31回R勉強会@東京(#TokyoR)
RとPythonによる
データ解析入門
@gepuro
ブログ: http://blog.gepuro.net
今日は、Pythonの
話をしに来ました。
* Tokyo.Scipyの
人ではありません。
先日、こんな本が出版されました
中身は、まだ読んでいません。
http://www.oreilly.co.jp/books/9784873116150/
目次をみると
● 武器と防具の装備
● いざマトリックスへ
● 8つの魔法の習得
● オフィスとトイレの関係
● ランチタイムの経済学者になる方法
● メールから自分を発見する
● 心臓の鼓動
● 鳥の群れを表現する
● お金と性別と進化
面白そう
目次しか見ていませんが、実際
のデータ分析例が書かれてい
るので、勉強になりそうです。
今日のタイトルは、
RとPythonによ
るデータ解析入
門です。
R Python [検索]
検索でヒットした
http://www.okada.jp.org/RWiki/?Python%20%A4%C7%A1%A1R
rpy2
PythonからRを
呼び出すことが
出来る!
僕が感じるメリット
● webのクローラを書く
● データベースを操作
● 文字列処理
● などが楽になる
● RとPythonの両方を覚える必要がある。
● Pythonで保持しているデータをRに渡す必要
僕が感じるデメリット
scikit-learnが物足りない!?
scikit-learn(Pythonの機械学習
ライブラリ)には、たくさんのモデ
ルが実装されているけど、R言語
には敵わない!?
scikit-learn
http://scikit-learn.org/stable/
ワクワクするグラフがたくさんあります!
データ操作はPandasで
Rでいうデータフ
レームがPython
で使えます!
scikit-learnとPandas
良い組み合わせだと思い
ます。実際に試してみて、
便利さを感じました。
Rでの処理
csv→前処理→
機械学習
よくある分析
webからデータ取得
→csvに整形→前処
理→機械学習
全部をRでやりますか?
こんな人がいるのでは?
●Perl,Ruby,Pythonと
かでデータを集めて、
●整形して
●Rを使う。
awkを使うことも。
全部を一つの言語からやりたい
Pythonを使って、
awkを使って、R
を使う。
それ、rpy2で出来ますよ
●Pythonならwebからのデータ取
得も楽々
●Pandasで、データフレームを
●機械学習は、rpy2でRに任せる
rpy2
PythonからRを
呼び出すことが
出来る!
大事な事なので二回言いました
インストール
pip install rpy2
簡単ですね。
使用方法
http://www.okada.jp.org/RWiki/?Python%20%A4%C7%A1%A1R#nb4e7b5b
簡単ですね
● importして
● robjects.r(’関数名')で呼び出して
● robjects.FloatVector()で値を渡して
● rmean(vec)で実行する
R言語を自在に
● robjects.r(“lm”)とすれば、R言語のlm()が使える。
● robjects.r(“summary”)も出来る。
● plot()の仕方は調べてます。良い方法がありました
ら、教えて下さい!!
pandasを使っても
●data["変数名"]のようにし
て、robejectsに渡せます。
●numpyからでも大丈夫
pandasの中身はnumpyです。
R言語を自在に
● robjects.r(“lm”)とすれば、R言語のlm()が使える。
● robjects.r(“summary”)も出来る。
● plot()の仕方は調べてます。良い方法がありました
ら、教えて下さい!!
library(“hogehoge”)
●
robjects.r(“””library(“MASS”)”””)って
やったら出来た。
●もっとスマートな方法がある気がする。
これで、stepAIC()も使えるようになるね。
とにかくrpy2を使ってみる
pandasの話もしたい
http://www.slideshare.net/gepuro/intoroduction-of-pandas-with-python
昔、しました。
ご清聴ありがとうございました

RとPythonによるデータ解析入門