タグ

統計学に関するlittle_elephantのブックマーク (9)

  • 産総研:ビッグデータから新たな科学的発見をもたらす統計手法を開発

    ビッグデータからの科学的発見のためには、正確な検定値(P値)の算出が必要。 超高速アルゴリズムを用いた新たな統計検定手法を開発し、発見力を大幅に改善した。 物理学、医学、化学など全ての実験科学において世界中での広い利用が期待される。 JST 課題達成型基礎研究の一環として、産業技術総合研究所 生命情報工学研究センターの津田 宏治 主任研究員(JST ERATO「湊離散構造処理系プロジェクト」グループリーダー)、東京工業大学 大学院情報理工学研究科 計算工学専攻の瀬々 潤 准教授、理化学研究所 統合生命医科学研究センターの岡田 眞里子 チームリーダーらは、従来に比べて格段に高い精度で誤発見の確率を示す検定値(P値)を計算するアルゴリズム(手順)を開発しました。 自然科学で得られるデータ量は増加の一途をたどり、これらを有効に解析できる方法が望まれています。しかし、従来の統計検定手法は観測できる

    little_elephant
    little_elephant 2013/07/23
    ビッグデータってこういう話でも出てくるんだね。当たり前と言えば当たり前か。|ビッグデータってつまりもの凄い量のデータってことなんだよね。そういうのを統計的に取り扱う新たな手法が開発されたってことか。
  • 統計学の面白さはどこにあるか - hiroyukikojimaの日記

    先日、とあるパーティで、統計学者の松原望先生と会った。 松原望先生は、早期からベイズ統計学の重要性を世にアピールしてきた先駆者である。ぼくは、経済学部の大学院在学時に、選択科目ではあったが、松原望先生の「ベイズ統計学」という講義を受け、そこでベイズ理論の指南をしていただいた。ぼくは『確率的発想法』NHKブックスや『使える!確率的思考』ちくま新書の中で、ベイズ理論を紹介していて、それが多くの読者にウケて、この二冊はセールス的にも良い実績を出しているのだけど、正直言ってここに書いてあることの多くは、松原望先生の講義の受け売りである。そういう意味では、下品ないいかたになるが、大学院の数ある講義の中で最も「金に換えることのできた」講義が先生の講義だった、ということになる。 そのときは、放送大学の教材であった『統計的決定』というを教科書に使った。これがめちゃくちゃいいで、今でもベイズ統計学に関し

    統計学の面白さはどこにあるか - hiroyukikojimaの日記
    little_elephant
    little_elephant 2013/06/29
    ベイズの定理も、初見だと単にベン図を書き直したのにしか見えなくて、何が凄いんだとか思ったものです。主観的に決めた確率値から、求めたい確率を定められるんよね。/逆に、確率の最も客観的な応用は統計力学かな
  • 因果関係がないのに相関関係があらわれる4つのケースをまとめてみたよ(質問テンプレート付き) - Take a Risk:林岳彦の研究メモ

    どもっす。林岳彦です。ファミコンソフトの中で一番好きなのは『ソロモンの鍵』です*1。 さて。 今回は、因果関係と相関関係について書いていきたいと思います。「因果関係と相関関係は違う」というのはみなさまご存知かと思われますが、そこをまともに論じていくとけっこう入り組んだ議論となります。 「そもそも因果とは」とか「因果は不可知なのか」のような点について論じるとヒュームから分析哲学(様相論理)へと語る流れ(ここのスライド前半参照)になりますし、統計学的に因果をフォーマルに扱おうとするとRubinの潜在反応モデルやPearlのdo演算子やバックドア基準(ここのスライド後半参照)の説明が必要になってきます。 その辺りのガッツリした説明も徐々に書いていきたいとは考えておりますが(予告)、まあ、その辺りをいちどきに説明しようというのは正直なかなか大変です。 なので今回は、あまり細かくて遭難しそうな話には

    因果関係がないのに相関関係があらわれる4つのケースをまとめてみたよ(質問テンプレート付き) - Take a Risk:林岳彦の研究メモ
    little_elephant
    little_elephant 2013/04/18
    偶然に成立した関係、逆の因果関係、疑似相関、選択バイアスの4種類ね/「合格点70点以上」の話は感心した。自分もやっちゃいそう。/id:rjj 母集団には相関関係がないが、採ったデータにたまたま相関が現れた、かな?
  • 相関関係と因果関係をごっちゃにしないために

    開米瑞浩 @kmic67 頭のいい人間がよく陥るワナのひとつに、「理屈をこねるのが上手いもんだから自分もだませるぐらいの理屈をこねて自分で信じてしまう」というのがありましてね・・・・ 2013-04-04 22:21:00

    相関関係と因果関係をごっちゃにしないために
    little_elephant
    little_elephant 2013/04/07
    wikiを見て知ったけど、疑似相関って、同じ原因Wに由来する2つの結果X,Y(W →X&Y)の間で観測される相関のことみたいだね。「本当の疑似相関」なら、まだ意味はある訳だ。疑似相関と全くの偶然の一致も区別しないとね
  • メンテナンスページ

    Website is under maintenance We are doing some updates on our site, and we need to be offline for a while. We will be back with you shortly! Twitter Facebook Instagram

    little_elephant
    little_elephant 2013/04/05
    文系的な推論で立てた仮説って、変なバイアスを掛けてるだけな気がするんだ。精神分析学や発達心理学が良い例。統計やパターン認識の威力が確認された時代だし、心理学はもっと文系っぼさがなくなっていくと思う。
  • PRMLガール 〜 文芸部のマネージャーが「パターン認識と機械学習」を読んだら 〜 - 木曜不足

    放課後の学は、普段なら常時腹を空かせた運動部の連中があちこちにたむろっているのだが、今日は珍しく先客は一人きりだった。 静かな様子にほっとしたカズは、まったり休憩でもしようとジュースを片手に奥の目立たない席を目指す。が、学で筆記用具を広げている女子生徒の横を通り過ぎたところで突然立ち止まった。 振り返ってその先客をよく眺めると、ツインテールの頭をどこか見覚えのある黄色いに乗せて、机に突っ伏すようにして寝ていた。カズは思わず近寄って、の正体を確認するためにのぞき込もうとしたそのとき。 「やっぱ、わかんない! ……って、ひゃあ!?」 「わわっ」 突然跳ね起きたその生徒は、目と鼻の先にいたカズの姿にびっくりして悲鳴を上げた。カズもやはり驚きうろたえてしまった。 二人してしばらくそのまま息をのむようにして顔を見合わせていたが、そのうちどちらともなくぷっと吹き出した。 「あはは、ごめん……す

    PRMLガール 〜 文芸部のマネージャーが「パターン認識と機械学習」を読んだら 〜 - 木曜不足
    little_elephant
    little_elephant 2013/01/17
    あの本は、難しくて内容が濃いって良く聞くけど、分量が多いんで、専門外だとまず読む気にならない。まあ、今はこういうので適当にお茶を濁しておきましょうか。
  • 「統計学関連なんでもあり」の過去ログ--- 039

    little_elephant
    little_elephant 2012/10/04
    "約68%が存在"、"正規分布に従わなければ,平均値と標準偏差からこのようなことを導くことはできません"、"左右対象な分布でないかぎり平均値ですら意味を持ちません"、"平均値は分布の重心"
  • はてなブログ | 無料ブログを作成しよう

    12月3日韓国に戒厳令が宣言された。そして寒空の元に届けられるコーヒー。 12月3日22時半ごろ、 どういうわけか尹錫悦大統領により非常戒厳が宣言された。それについて、韓国で生活をする私の視線で記録をしておきたいと思う。今週は書きかけだった高雄&台南旅行記をスタートさせたかったが、後回しにする。 (写真は今回の弾劾を求めるデモで…

    はてなブログ | 無料ブログを作成しよう
    little_elephant
    little_elephant 2012/01/11
    興味があるけど、読むにはちょっと難しいな… とりあえず、ブクマ
  • 統計学を勉強するときに知っておきたい10ポイント - Issei’s Analysis ~おとうさんの解析日記~

    googleさんやマイクロソフトさんは「次の10年で熱い職業は統計学」と言っているようです。またIBMは分析ができる人材を4,000人増やすと言っています(同記事)。しかし分析をするときの基礎的な学問は統計学ですが、いざ統計学を勉強しようとしてもどこから取りかかればいいか分からなかくて困るという話をよく聞きます。それに機械学習系のは最近増えてきましたが、統計学自体が基礎から学べるはまだあまり見かけないです。 そこで今回は、統計学を初めて勉強するときに知っておいた方が良い10ポイントを紹介したいと思います。 1. 同じ手法なのに違う呼び名が付いている 別の人が違う分野で提案した手法が、実は全く同じだったということがあります。良く聞くのは、数量化理論や分散分析についてです。 数量化理論 数量化I類 = ダミー変数による線形回帰 数量化II類 = ダミー変数による判別分析 数量化III類 =

    統計学を勉強するときに知っておきたい10ポイント - Issei’s Analysis ~おとうさんの解析日記~
    little_elephant
    little_elephant 2011/07/11
    統計学は数学ですよ。反論してくる人もいるけどね。確かに、値に対して量とか母集団とか、数学・自然科学と違ったイメージもする。あああいう考え方は1つの哲学だと思う。体系を、初めて習ったときは感動ものや。
  • 1