自殺の時空間疫学 http://ikiru.ncnp.go.jp/ikiru-hp/genjo/toukei/index.html 少研究数のメタ分析 Noma, H. Statist. Med. 2011, 30 3304–3312 K=10以下での信頼区間を向上させる Topics はじめに 推測統計の基本 最尤推定とベイズ推定 MCMCによるベイズ推定
対応のない 2 群間の量的検定手法として、最も有名なのは Student の t 検定でしょうか。 以前、Student の t 検定についての記事を書きました。 小標本問題と t検定 - ほくそ笑む しかし、Student の t 検定は、等分散性を仮定しているため、不等分散の状況にも対応できるように、Welch の t 検定を使うのがセオリーとなっています。 ただし、これら 2つの検定は分布の正規性を仮定しているため、正規性が仮定できない状況では、Mann-Whitney の U検定というものが広く使われています。 Mann-Whitney の U検定は、正規性を仮定しないノンパラメトリック検定として有名ですが、不等分散の状況でうまく検定できないという問題があることはあまり知られていません。 今日は、これらの問題をすべて解決した、正規性も等分散性も仮定しない最強の検定、Brunner-
35. ところが実は施策実施の詳細なデータも同時にあるとする 35 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 ad1 0 1 1 1 0 0 1 0 1 0 1 0 1 1 0 0 1 0 1 1 0 0 1 0 0 1 1 1 1 0 0 0 0 1 1 0 0 0 1 1 ad2 0 1 0 0 1 1 1 0 0 0 1 1 1 0 0 1 1 1 0 0 0 0 1 1 0 0 1 0 1 1 1 0 0 0 1 0 1 1 1 0 ad3 0 1 1 0 0 1 0 1 1 1 0 0 1 0 0 1 0 0 0 1 0 1 1 1 0 0 1 1 0 0 1 1 0 0 0 1 1 0 1 1 ad4
主張 縦軸に目盛のない棒グラフや折れ線グラフを描くのはやめよう。 棒グラフ 以前の職場でよく見かけた棒グラフがこのようなものでした。 これは万能棒グラフです。 2007-10-22 - 定義すれば存在する 目盛のベースラインが 0 スタートでなくてもいい 目盛線は省略していい という風に棒グラフを書いてしまうとどんなデータにもあてはまる、万能棒グラフができあがります。 どんなデータにもあてはまるとは、つまりデータの特徴をなにも表せていない統計グラフということです。 統計グラフとしての機能をはたしません。 折れ線グラフ また、このような折れ線グラフもよく見かけました。 ここで、折れ線グラフは縦軸の幅を広くとれば大きな差を小さくみせ、狭くとれば小さな差を大きく見せることができることに注意してください。 縦軸に目盛がないと、この目盛操作に気づくのは困難です。 退職の理由 わたしは新卒で Web
アナタのデータ分析はただの「現状分析」かもしれない!?明日から使える「データ」への向き合い方と考え方をfreeeのデータマイニングエンジニア坂本さんに教えてもらいました。 データ分析→活用、ホントに出来てる? 昨年辺りから、ビックデータやデータサイエンティストがある種「バズワード化」して久しいですね。 ただ、データというものは決してプロフェッショナルだけが扱うものではありません。様々な業界・業種の人が日々、データと向き合っているもの。Excelが使えるからといって、「データ分析ができている」と勘違い…いや錯覚している人も多いのでは!?ここは基礎から、データの扱い方・考え方についてプロから学んでみましょう。 今回ご寄稿いただいたのは、10万以上の事業所が導入している「全自動のクラウド会計ソフト freee」でデータマイニングエンジニアを務める坂本さん。 明日から使える考え方が詰まっています。
グロースハックを本格的にしようとすると、統計学が出来ると凄く便利!今回は、この記事を見ておけば今からでも統計学を使いこなせるようになる記事をピックアップしましたので、ご覧下さい! ハンバーガーショップで学ぶ楽しい統計学 本にもなっている統計学の入門には最適な決定版サイト。広く使われている統計手法について分かりやすく解説されています。 オンラインで無料で読める統計書22冊 Web上で閲覧可能な統計書がまとめられている超お得な情報が詰まっている記事。 WEBで読める統計関係の良質な資料 統計に関する良質な資料がまとめられている記事。 統計屋による新社会人のための統計系入門書お薦め一覧 統計について学べる入門書についてまとめられている記事。 統計学を勉強するときに知っておきたい7つのポイント 統計学を学ぶ上で、重要なポイントが整理されている記事。 統計学を勉強するときに知っておきたい
「データで表現したいことを、効果的にひと目でわからせるための、グラフの種類の選び方、作り方」を紹介する本連載。これまでに「1つのグラフには1つの主張」という考え方をベースにして、「4つのグラフの使い分けポイント」「円グラフ」「棒グラフ」「折れ線グラフ」「2軸グラフ」の作成ポイントと注意点を順に解説してきました。今回は散布図とバブルチャートをご紹介して、本連載の最終回とします。 項目間・指標間の関係性を見るグラフまず第2回でご紹介したグラフを再掲載します。これはある媒体のバナー広告のインプレッション数とリーチ(累積到達率)を広告素材ごとにプロットしたグラフです。1つの点がそれぞれ1つの広告素材のインプレッション数とリーチを表しています。たとえば、一番右上にある点として表現された広告素材だと、リーチ数が約320万人で約 1.8億インプレッション表示されたということを意味します。このように散布図
ニコ動データ分析クラスタの巨人・myrmecoleon氏が、みんな知ってるようで知らないニコニコ動画の現在をグラフで紹介! 2015年03月26日 18時00分 トピックス ネコ・イヌ・インコ・ハムスター・ハリネズミ……さまざまな動物が見られます 第45回 AVと言えばアニマルビデオ~動物動画の世界 今回はみんな大好きな動物タグの動画を調べてみました。 2015年03月12日 18時00分 ゲーム・ホビー pixivでは三日月宗近と加州清光が人気、ニコ動では織田&伊達の愛刀が舞い踊る! 第44回 女性提督が審神者に? ニコ動・pixivを席巻する刀剣乱舞人気の現状を調べてみた 今回は1月のサービス開始より大人気の「刀剣乱舞」を調査してみました。 2015年02月26日 18時00分 トピックス ボカロ・東方・艦これと女性人気と 第43回 第14回MMD杯と多様化するMikuMikuDanc
ウェブアナリスト 宏美のブログ。WebAnalyticsの3Cデータと関連情報を提供。一つはcompetitor、市場マクロデータや競合データ。一つはcompany、自社のアクセス解析データ。最後はcustomer、ユーザー行動データ。数値の一人歩きをさせたくないので、詳しくは原典と各調査方法を確認のこと。 続いて、仕事時代の最終ステージ。なおこの回顧録には自分以外に登場する人達がいるが、直接的な人物名の記載はない。但し一部所属や肩書などの記載から推測できる場合はあるが、自分との関係性の文脈で必要最小限にしか触れていない。 ・独立時代 さあ、いよいよ自分で会社を作って仕事だ。初めから誰かを雇う積りはなく、大きくする野望もなく、最後まで一人取締役のみという株式会社だった。初めからある程度の仕事は持っていて独立できたので、いろいろと試行錯誤する時間が持てたことも幸いし、幕を閉じる2023年まで
データサイエンティストブームですね。というのはおいといて、弊社でも統計学をいろんなひと(特にディレクタやデザイナとか)が学んで使えるようになるといいよねという感じで、みんなで勉強しよう!みたいなことをしています。今日は、若手敏腕ディレクタのzaimyが、下記資料に基づく勉強会をしてくれました。 http://www.storyboards.jp/viewer/u0arvn 僕も目下勉強中なのでなんもわからないのですが、読んだ本のうち、統計学に馴染みのない人向けでよかったものについて社内向けにまとめてみたので、こちらにも転載しておきます。 完全独習 統計学入門 作者: 小島寛之出版社/メーカー: ダイヤモンド社発売日: 2013/06/17メディア: Kindle版この商品を含むブログ (2件) を見る これが一番オススメです。見た目は固そうですが、簡単だし、内容もいいと思います。Kindl
『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine Academy』『MarkeZine プレミアムセミナー』の 最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day
(※※※続編記事書きました→「使い分け」ではなく「妥当かどうか」が大事:重回帰分析&一般化線形モデル選択まわりの再まとめ) 今ちょうどadtech tokyo 2013の会期中で、職場からも近い&会社から行ってこいという指示が出たということで僕も色々セッションを聞いたり企業ブースのお話を聞いたりしてる*1ところです。 ところで、いくつかのセッションの中でキーワードとして「重回帰分析」という言葉が出てきてました。ま、それ自体はこのブログでもRによるデータ分析絡みで頻出だし、ぶっちゃけありふれた手法と言って良いでしょう。やりようによっては普通にExcelでもできますし、それだけ人口に膾炙していると言って良いのかもですね。 ただし。意外にも内部のパラメータというか細かい手法の分岐というか、それこそ普通の線形モデルvs.一般化線形モデル(バリエーション多数)があることを無視して漫然と重回帰分析をや
「どれぐらいフォロー解除されているか」「自分のツイートのリンクは何回クリックされたのか」「自分のフォロワーは何に興味を持っている人が多いのか」「自分のサイトに埋め込んだツイートボタンは何回クリックされたのか」「自分のサイトのページでたくさんリツイートされたのはどれか」といったアクセス解析ができる「アナリティクス」機能が日本のTwitterの一部アカウントで利用可能になっています。これは2011年9月に「Twitter Web Analytics」として発表されていたもので、2011年7月にTwitterが買収した「BackType」というTwitterのアクセス解析サービスを改良したものになっており、GIGAZINEの公式Twitterアカウントでも利用可能になっていたので早速使ってみました。 ログインして右上にある設定アイコンから「アナリティクス」と書いてあるメニューが見えれば利用可能な
追記 2016年3月に以下の記事によってこの内容はupdateされています。今後はそちらをお読み下さい。 主に自分向けのまとめという意味合いが強いんですが(笑)、僕が実際に2013年6月現在webデータ分析&データサイエンスの実務でツール・ライブラリ・パッケージを利用しているものに限って、統計学・機械学習系の分析手法を10個挙げて紹介してみようと思います。 追記 回帰分析(特に線形重回帰分析) 独立性の検定(カイ二乗検定・フィッシャーの正確確率検定) 主成分分析(PCA) / 因子分析 クラスタリング 決定木 / 回帰木 サポートベクターマシン(SVM) ロジスティック回帰 ランダムフォレスト アソシエーション分析(バスケット分析・相関ルール抽出) 計量時系列分析 おわりに おまけ1:「素性ベクトル+分類ラベル」なるデータ前処理 おまけ2:グラフ理論*10 {igraph}パッケージでグラ
Yahoo! JAPANトップページの機能を正しくご利用いただくには、下記の環境が必要です。パソコンでご利用のお客様 Windows:Internet Explorer 11.0以上 / Chrome 最新版 / Firefox 最新版 / Microsoft Edge macOS:Safari 9.0以上 ※Internet Explorer 11.0以上をご利用の場合は、 「Internet Explorerの互換表示について」を参考に、互換表示の無効化をお試しください。タブレットでご利用のお客様 iOS 9以降、または、Android4.0以降のOSに標準搭載されたブラウザー ※日本国内版として発売されている端末でご利用ください。
ネットで面白いコピペを発見したので貼り付けておきますね。 山岡「こちらが我々の考える究極のデータサイエンティストです。」 京極「なんやて、経済学部出身やないか!ITに統計学、業務、この中で先の二つの技術的素養が必要なデータサイエンティストには理系出身者が定石やで山岡はん。」 山岡「確かに、数学のスキルが要求されるデータサイエンティストには普通の文系出身者は厳しい。しかし、彼の学部時代の専攻は計量経済学。実務では高度なアルゴリズムやビックデータの解析基盤の構築のスキルなんか本当は必要ない、経済学の手法が求められているんだ。」 京極「なんやてっ!」 山岡「ビッグデータといっても、小売りの場合大きくて1千万件程度、普通のRDBMSで処理可能だし、非構造化データなんて必要ない。アルゴリズムもSPSSやRなんかのツールに入力して結果を解釈できれば十分なんだ。一方で、政府の統計を駆使して地域の需要を推
概要 ここしばらく某社でデータの解析基盤を構築する仕事に携わっています。一からの構築になるので打てる手が多く楽しい一方で、適切な判断を下すのは難しいと実感しています。 解析基盤というのはもちろん解析を行うためのものですので、どう解析を行うかによってどういう基盤を構築していけばよいかが決まります。 ところで、データ(構造や収めているDBなども含めて)というのは寿命の長いもので、初期の設計を間違えてしまうと、その時点で戦略的な敗北は決まってしまいます。その後は運用しながら変更可能なところでゲリラ的に対応していくしか手を打てません。 そのため、実際に構築を行う前に、求められている解析がどのようなものかを十分に吟味した上で、適切なハードウェア、ミドルウェア、データ構造を選択し基盤を構築していくことが大変重要です。 着目すべき点 では解析のどのような点に着目すればよいかというと、私は次の5点を考えて
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く