タグ

統計学に関するshibacowのブックマーク (5)

  • Rでデータ分析・統計学・機械学習・データマイニングを学ぶならこの10冊で(2015年2月版) - 渋谷駅前で働くデータサイエンティストのブログ

    今週はまともなデータ分析やら統計学やら機械学習やらの記事を書くのが面倒になったので*1、しばらくやってなかったお薦め書籍リストでも書こうかと思います。 今回まとめるリストは、ズバリ「Rでデータサイエンス・統計学・機械学習を学ぶための10冊」。Rと言えばこのブログのメイン言語なので特に説明は要さないでしょう。去年1年間は拙著も含めてR絡みのが大豊作で、以前のお薦め書籍リストに比べるとRの良書が増えたという部分もあり、そう言えばRだけでリスト作れるなぁと思ったのでした。 というわけで、主に僕が持っているor読んだことがあるを中心にお薦めリストをまとめてみました。いつも通り独断と偏見まみれなので、他にも良いRは沢山ありますよーという旨予めお断りしておきます。 そうそう、先に書いておきますがこのリストは中級者向けです。でも初学者向けに良いRのってあるのかなぁ。。。初学者はまずはExcel

    Rでデータ分析・統計学・機械学習・データマイニングを学ぶならこの10冊で(2015年2月版) - 渋谷駅前で働くデータサイエンティストのブログ
  • なぜ統計学がビジネスの 意思決定において大事なのか?

    35. ところが実は施策実施の詳細なデータも同時にあるとする 35 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 ad1 0 1 1 1 0 0 1 0 1 0 1 0 1 1 0 0 1 0 1 1 0 0 1 0 0 1 1 1 1 0 0 0 0 1 1 0 0 0 1 1 ad2 0 1 0 0 1 1 1 0 0 0 1 1 1 0 0 1 1 1 0 0 0 0 1 1 0 0 1 0 1 1 1 0 0 0 1 0 1 1 1 0 ad3 0 1 1 0 0 1 0 1 1 1 0 0 1 0 0 1 0 0 0 1 0 1 1 1 0 0 1 1 0 0 1 1 0 0 0 1 1 0 1 1 ad4

    なぜ統計学がビジネスの 意思決定において大事なのか?
  • 誤解しやすかったり紛らわしかったりする統計の話達 - Interdisciplinary

    統計の話題で、こういう誤りをよく見るなあ、とか、ここら辺はややこしいなあ、的なものを、エッセイ風に書いてみます。 各トピックの最後に、参考資料を紹介したりします。 色々な話題を扱うので、エントリー全体で、このくらいの知識を持っている層向け、みたいな想定はしていないです。下に行くほど、知っている人向けになる、という感じ。 標数と標の大きさ 調べたい集団全体から採り出した個体の数の事を、標数と書くのをよく見かける。でも正確にはこれは、標の大きさと言う。この違いは、標という言葉をどのように捉えるか、に起因するもの。標を、調べたい集団に属する要素と考えるか、含まれる集合と捉えるか。前者で考えると標数を使う事になるけれど、抽出した集まりそのものを標とすれば、標数とは言えなくなる。で、集合に属する要素の数の事を、集合論では大きさというので、それを踏まえて、標の大きさと言う。 たとえ

    誤解しやすかったり紛らわしかったりする統計の話達 - Interdisciplinary
  • [書評]統計学が最強の学問である(西内啓): 極東ブログ

    統計学をその「意味」の視点からこれほどわかりやすく解説した書籍はないのではないか。「統計学が最強の学問である」(参照)という表題は挑戦的だが、実際、後半部の応用分野との関わりの解説に力点を置いて読むならなら適切とも言える。しかしなにより、統計学をわかりやすく解説した入門書としてすぐれている。現代人ならどうしても統計学の基礎知識は必要となるので、そういう点からも必読書と言ってもいい。 書の内容は、cakesに連載されていたもので、私も連載当初から読んでいた。語り口が豊かでまた逸話も面白く、オンラインの読み物としてもすぐれているのだが、中盤の回帰分析の説明あたりから、これは集中して読んだほうがいいなと思い直し、年末から正月、Kindle PaperWhiteのブラウザー機能に落とし込んで読んだ。ある程度、濃密なコンテンツになると依然、書籍というのは有利なもので、この連載が書籍化されるなら、早

  • 説明と選抜:統計学における2つの「関心」 - 社会学者の研究メモ

    社会学者や経済学者にとって、統計学をベースにした計量分析とは、何かを因果的に説明する道具であるという側面がある。賃金を学歴で説明するというとき、それは他の条件が同じで学歴が変化したときの賃金の変化量を推定する、という意味である。 (記述的な分析手法を含めて)統計学を学ぶ人のほとんどは、この「説明(explanation)」のためにそれを学んでいるのだと考えられる。 しかし統計学には、それとは全く異なった目的が託されることもある。それは「選抜(selection)」である。統計学を選抜に使うというのは、それをアカデミックに活用している研究者からみても、実はあまり馴染みのない考え方である。というのも、あとで詳しく述べるが、選抜は学問的説明とは相容れない考え方だからだ。 しかし選抜は、実践家においては大いに意味がある考え方である。「限られた回数の耐久力テストの結果から、真に優れた個体を選抜する」

    説明と選抜:統計学における2つの「関心」 - 社会学者の研究メモ
    shibacow
    shibacow 2012/01/27
    選別のための統計学はPDCAをまわせる。説明のための統計学は、PDCAをまわせない。そのため、長期的に精度に差が出ることはあるのだろうか?選別した固体がだめだった際に、見直しのフィードバックがかかる。
  • 1