タグ

統計に関するkent013のブックマーク (18)

  • 私のための統計処理 ー多重比較検定

    [基解説→ポストホックテストとしての多重比較検定]  →[検定-1要因多群-2要因多群] →[ANOVA] 独立した群が3群以上あるとき、どの群とどの群の平均値に有意差があるかを検定! 基的に、多重検定は、2群比較のためのt検定の拡張版である。 比較の数が増加する(=2群ずつの検定を繰り返す)ことによる第一種の過誤の増大を調整するために、危険率の補正方法が異なる種々の検定がある。↓ (棄却域:Fisher PLSD < Tukey < Bonferroni < Scheffe) ◎多重比較の2通りの立場 ・事前比較 (A priori comparisons): 結果を分析する前に,理論的な背景などにより,比較する平均値についての仮説がある場は、 ANOVA抜きで、多重比較を行う。 ・事後比較 (Post hoc comparisons): 比較する平均値についての明確な仮説がない場合

  • http://igproj.com/zone1/index.php?R%20%E3%81%AB%E3%82%88%E3%82%8B%E3%83%87%E3%83%BC%E3%82%BF%E3%81%AE%E7%B5%B1%E8%A8%88%E7%9A%84%E5%8F%96%E3%82%8A%E6%89%B1%E3%81%84%2F%E6%A8%99%E6%BA%96%E8%AA%A4%E5%B7%AE

  • KuboLog 2007-02-15

    kent013
    kent013 2012/06/06
    QQプロットはロジスティックではみる必要なし
  • 多重ロジスティック回帰 - Action Potentials: 閾値以下

    今度は説明変数を複数含む多重ロジスティック回帰を行なってみる。データは Kutner et al. "Applied Linear Statistical Models" (5th Ed) の14章にある疫病のアウトブレイクについて。目的変数はその疫病に感染したかどうか、説明変数は年齢、社会経済的地位(カテゴリカル、3水準)、都市での居住地区(2水準)の3つ。ただし、社会経済的地位の変数は3水準あるために2つのダミー変数(socio1, socio2)を使う。データにはあらかじめそのダミー変数が用意され、コーディングもされてある状態。glm() の使い方は基的に説明変数が1つの場合と同じ。 > # Reading data... > epidem <-read.table("http://apps.csom.umn.edu/Nachtsheim/5th/KutnerData/Chapte

    多重ロジスティック回帰 - Action Potentials: 閾値以下
    kent013
    kent013 2012/06/06
    GLMの結果考察
  • 生態学データ解析 - 統計学授業 2008

    教科書化のお知らせ: この「講義のーと」が 教科書 として出版されました!! (2012-05-18) 講義のーと PDF ファイルは北大図書館 HUSCAP からダウンロードできます (2012-07-13) 統計学の授業やります (2008 年度後期, 2008 年 10 月 27 日より) 教室: 北大・地環研 A 棟 8F A803A 教室 講釈: 久保拓弥 2008 年 10/27-11/13 の講義 (+ 補講 2 回) (第 1 回) 10/27 (月) 生態学データ解析の統計モデリングとは? (第 2 回) 10/30 (木) さまざまな確率分布と最尤推定 (第 3 回) 11/06 (木) 一般化線形モデル (GLM) 1 -- ポアソン回帰 (第 4 回) 11/10 (月) 一般化線形モデル (GLM) 2 -- ロジスティック回帰 (第 5 回) 11/13 (木)

    kent013
    kent013 2012/06/05
    いままでで一番分かりやすいかも。
  • R-Source

    回帰分析を行なうために以下の関数が用意されている. lsfit() : 最小二乗法による回帰を行う. lm() : 線形モデルによる回帰を行う glm() : 一般線形モデルによる回帰を行う ここで対象となるモデルは以下のような線形モデルである. 上式をベクトル表記すると y = Xb + e となる.このときの y は応答ベクトル,X は説明変数のベクトル(モデル行列)で,x0 は切片項(要素が全て 1 である列ベクトル)となっている. 回帰分析と重回帰分析 関数 lm() により線形モデルの当てはめを行うことが出来る.この関数により,回帰分析や分散分析,そして共分散分析を行うことが出来る. 詳しい解説は『工学のためのデータサイエンス入門』(間瀬・神保・鎌倉・金藤 共著,数理工学社) を参照のこと.分散分析や非線形回帰についても詳しい解説が載っている. 関数 lm() の書式と引数 書式

    kent013
    kent013 2012/06/05
    回帰分析
  • http://yaplog.jp/after-rain/archive/270

  • 統計学入門−第10章

    10.3 ロジスティック回帰分析の計算方法 (1) 最小2乗法を利用する方法 ロジスティック回帰分析ではロジットの回帰誤差が特殊な分布になり、普通はその分布を理論的に確定することができません。 そのため回帰誤差が近似的に正規分布すると見なして重回帰分析と同じように最小2乗法を利用して回帰分析を行う方法と、最尤法を利用した繰り返し近似計算によって回帰分析を行う方法の2種類があります。 最初に最小2乗法を利用する方法について説明しましょう。 この場合の線形ロジスティックモデルは次のようになります。 このモデルでは説明変数xjの値を研究者が任意に指定した時、ロジットの回帰誤差εが近似的に正規分布すると仮定します。 ただしロジスティック回帰式を計算するには回帰誤差の正規性は必要ではなく、検定を行う時だけ回帰誤差の正規性が必要になります。 そして説明変数は研究者が任意の値を指定するので誤差がなく、正

  • 統計学を勉強するときに知っておきたい10ポイント - Issei’s Analysis ~おとうさんの解析日記~

    googleさんやマイクロソフトさんは「次の10年で熱い職業は統計学」と言っているようです。またIBMは分析ができる人材を4,000人増やすと言っています(同記事)。しかし分析をするときの基礎的な学問は統計学ですが、いざ統計学を勉強しようとしてもどこから取りかかればいいか分からなかくて困るという話をよく聞きます。それに機械学習系のは最近増えてきましたが、統計学自体が基礎から学べるはまだあまり見かけないです。 そこで今回は、統計学を初めて勉強するときに知っておいた方が良い10ポイントを紹介したいと思います。 1. 同じ手法なのに違う呼び名が付いている 別の人が違う分野で提案した手法が、実は全く同じだったということがあります。良く聞くのは、数量化理論や分散分析についてです。 数量化理論 数量化I類 = ダミー変数による線形回帰 数量化II類 = ダミー変数による判別分析 数量化III類 =

    統計学を勉強するときに知っておきたい10ポイント - Issei’s Analysis ~おとうさんの解析日記~
  • 多変量解析

    この表から、売上高を目的変量(Y)、広告費を説明変量1(X1)、営業人数を説明変量2(X2)として、 重回帰分析を適用すると、 Y=8.627×X1+4.608×X2+1.0196 という1次式が得られる。 重回帰分析によって得られた式より、広告費と営業人数の値を入れると売上高がわかる。 式の中にあるX1とX2の前にある値を回帰係数といい、この回帰係数が大きいほど、目的変量に対して影響の大きい説明変量であることを示している。ただし、影響度については、係数を標準化してから判断する。この場合では、広告費の標準化係数は0.742、営業人数の標準化係数は0.364である。したがって、売上高に対しては、広告費の方が営業人数よりも影響が大きいことがわかる。 ※重回帰分析を適用する場合は次のことを満たしておかなければならない。 1)式で求めた予測値と実際の値とに基づく決定係数が1に近いこと。少な

    kent013
    kent013 2012/06/02
    分かりやすい
  • データの種類

    定性的データ ( 質的変数,カテゴリーデータ,カテゴリカルデータ ) (単にカテゴリーデータという場合,名義尺度を指すことがある.この場合,順序尺度は順序カテゴリーデータという.)

  • 生態学データ解析 - FAQ 一般化線形モデル

    ここでは R の glm() を使って解析した場合の説明をしてみます 参照: FAQ 系ペイジ一覧, GLM 参照, summary(glm()) の星 この説明もしっかり読みましょう!信頼区間って難しい… [項目] 研究発表で「GLM を使った」と説明するときにはどうしたらよいでしょうか? GLM で得られた結果を発表・説明するときにはどうしたらよいでしょうか? 説明変数,応答変数って何ですか? family で指定する確率分布は「誤差の分布」ですか? family 指定はどうすればよいのでしょうか? 応答変数のばらつきが family 指定ではうまく表現できないときはどうすればいいのでしょうか? (一般化) 線形モデルは必ず交互作用項を含んでいなければならないのですか? glm() とかで Y ~ X1 + X1:X2 というふうに X2 は使わないときに交互作用項 X1:X2 だけを

  • 学校基本調査:文部科学省

    調査の概要 調査の概要 ・調査の目的  ・調査の沿革  ・調査の根拠法令  ・調査の対象 ・抽出方法    ・調査事項    ・調査票        ・調査の時期 ・調査の方法 調査の結果 結果の概要 ・平成12年度調査から令和5年度調査までの結果の概要を掲載しています。 年次統計目次 (PDF:37KB) ・年次統計の目次を掲載しています。 統計表目次 (PDF:413KB) ・令和5年度調査で集計したすべての統計表の目次を掲載しています。 年次統計・統計表一覧 (※政府統計の総合窓口(e-Stat)のホームページへリンク) ・年次統計には,学校数,在学者数,教職員数,進学率,就職者の割合など,調査開始から最新のデータまでを掲載しています。 ・統計表一覧には,昭和23年度報告書から最新の報告書まで掲載しています。 用語の解説 結果の集計 利用上の注意 正誤情報 その他 令和6年度学校基

    学校基本調査:文部科学省
  • 「最新SNS利用動向レポート」を更新しました。 | ニュースリリース | ニールセン デジタル株式会社

    2011年10月の日の主要SNSサイトの動向 ニールセン・ネットレイティングスのインターネット視聴率NetViewの2011年10月データによる日の主要SNSサイトの利用動向では、Facebookが引き続き堅調に訪問者数を増加させています。 一方、mixiは訪問者数に今月大きな変動があるかに見えますが、この現象は弊社のネット視聴率の集計処理の変更に起因するもので、mixi自体の訪問者数が突然減ったわけではありません。図1の参考値(黄緑で示されているmixiの推定訪問者数)のとおり、mixiの訪問者数は実際には堅調に推移していると推測されます。 図1 日の主要SNSの訪問者数の推移 (家庭と職場のPCからのアクセス) 注1=mixi(参考値)は弊社が2011年10月に実施した集計対象外URLとしたURLを含めずに訪問者数を推計した値です。 弊社の視聴率レポートはインターネットユーザーが

    「最新SNS利用動向レポート」を更新しました。 | ニュースリリース | ニールセン デジタル株式会社
    kent013
    kent013 2011/11/29
    Mixiの批判に応えてあげたらしい.まぁ集計方法が違うのに同じグラフの同じ系列で表現したのが悪い.
  • 2010年の世界のインターネット事情とソーシャルネットワークの利用実態をまとめました | URAMAYU

    World Inernet & Social Networks Stats 2010. 出展:World Map of Social Networks 2010 | DreamGrow Social Media 世界各国のインターネット利用実態、そしてFacebookなどのソーシャルネットワークサービスの普及度合いなどをシンプルにまとめてみました! こういうデータを見てみたかったのに、参考になるサイト(特に日語)がパッと見当たらなかったので、大人の自由研究的に自分で調べて表とグラフにしてみました。 (内容の不整合が多少あっても大目に見てね) 上の図は世界のソーシャルネットワーク世界地図ですが、Facebookが圧倒的ですね~。 いくらその国でFacebookが流行っていても、インターネット人口の母数が少なければあまりピンと来ないよね…。 ということで、まずは世界のインターネット人口上

  • 内閣府ウェブサイトの常時暗号化による「https:」への切り替え - 内閣府

    内閣府ウェブサイトの常時暗号化による「https:」への切り替え Always on TLS of Cabinet Office Website 2019(令和元)年11月更新 Update,November,2019 内閣府ウェブサイトは、2018年11月29日より、常時暗号化通信(TLS1.2)となり、URLが以下のとおり、「https:」に変更となりました。※ ブックマーク機能等に「http:」で始まるURLを登録している場合や、リンクを貼っている場合等は、「https:」から始まるURLに切り替えていただきますよう、お願いいたします。 ※参考:2018年11月から2019年10月までは、httpによる接続を可能とする自動遷移の経過措置をとっておりました。 内閣府ホームページ(https://www.cao.go.jp/) 内閣府共通検索システム Cabinet Office has

    内閣府ウェブサイトの常時暗号化による「https:」への切り替え - 内閣府
  • The Gapminder World

    Animated global statistics that everyone can understand

    The Gapminder World
    kent013
    kent013 2010/12/25
    この可視化はおもしろすぎる。しかし、日本のGDPは30年くらいそんなに変わってないんだな。アメリカとの相対的な関係は40年くらい変わってないし。/1万ドル変わってた。
  • http://release.center.jp/

  • 1