関連タグで絞り込む (1)

タグの絞り込みを解除

Rに関するkomukuのブックマーク (19)

  • R で個体差のあるロジスティック回帰1 - glmmML - なんとなくな Developer のメモ

    前回 のロジスティック回帰に続き、書籍 「 データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学) 」のサンプルを使って個体差を考慮したロジスティック回帰を GLMM と階層ベイズモデルで試してみます。 (1) GLMM によるロジスティック回帰 (glmmML 関数) (2) MCMCglmm を使った階層ベイズモデルによるロジスティック回帰(MCMCglmm 関数) ただし、今回は (1) だけで (2) に関しては次回に書く予定です。 サンプルソースは http://github.com/fits/try_samples/tree/master/blog/20140209/ はじめに パッケージのインストール 今回使用するパッケージを R へインストールしておきます。 install.packages("glmmML") データ デ

    R で個体差のあるロジスティック回帰1 - glmmML - なんとなくな Developer のメモ
    komuku
    komuku 2014/03/25
  • ゼロ・インフレーション - 作業日誌

    他人の学会準備状況を偵察すべく,ネット上を徘徊.事務局当番の粕谷さんはいよいよ修羅場ってるな……むう,竹中さんと久保さんは例によって順調そう……ぶっ,アマノさんまだ準備中じゃーん!……と,自分同様に切羽詰まってる知り合いを見つけて喜ぶ.せこい. 昨夜 New Order の助けを借りてシミュレータを改訂し,地形ニッチの組み込みに成功.……しかし案の定,あちこちしょうもないバグにひっかかる.ポアソン回帰で得られた期待値を計算するのに exp(回帰式)つけてないとか,関数定義でミススペルとか,100 行超えるとミスの数もスゴイ.少しずつ問題を切り分けながら,気の遠くなるよーなデバッグ作業を繰り返す. そのうち,壁にぶち当たる.移入プロセスのシミュレーションで,現実の三倍くらい加入してしまうエラーが直らないのだ.コード自体はもう,直すところがない.時間は刻々と過ぎていく.学会まで三日,さすがに(

    ゼロ・インフレーション - 作業日誌
  • matplotlibで等高線やら何やらのプロット - たこ焼き食べた.net

    今回は等高線や、疑似カラープロット(?)に挑戦です。 今までと違い、x, yのデータの他にz方向のデータを持っています。 以前のお話はこちら matplotlibでグラフを書く - たこ焼きべた.net 疑似カラープロット(?) 行列の作り方 これは以下の等高線などでも使う知識なので重要です。 今回挑戦するx, y, zの3軸の情報を持つグラフは、今までと若干行列の与え方が異なります。 例えば、5*5の行列をプロットするとすると以下の行列が必要となります。 このように、x, y, zがそれぞれ、5*5の情報を持つ必要があります。 通常、x, y, zは x = arange(5) y = arange(5) Z = array([[24, 32, 12, 16, 21], [23, 24, 25, 26, 27], [43, 36, 32, 26, 25], [30, 32, 25, 2

    matplotlibで等高線やら何やらのプロット - たこ焼き食べた.net
    komuku
    komuku 2014/01/29
  • log 変換する?しない?AICでモデル比較するときの注意点 - ほくそ笑む

    データを分析にかける前に、出力変数を log 変換する、というのはよくあることだと思います。 次のデータを見て下さい。 このデータ、線形モデルに当てはめる前に log 変換したほうがよさそうだなーというのが見てとれます。 それもそのはず、このデータは次のように作っています。 N <- 100 x <- runif(N, min = 1, max = 2) y <- exp(x + rnorm(N, sd = 0.3)) data <- data.frame(x, y) それでは、log 変換しないバージョンと、するバージョンでモデルを作成して、AIC を比較してみましょう。 model <- lm(y ~ x, data) model.log <- lm(log(y) ~ x, data) aic <- AIC(model, model.log) print(aic) ## df AIC

    log 変換する?しない?AICでモデル比較するときの注意点 - ほくそ笑む
  • Rの基本パッケージ中の平滑化関数一覧 - RjpWiki

    RjpWiki はオープンソースの統計解析システム R に関する情報交換を目的とした Wiki です核関数を用いた平滑化 Nadaraya-Watson による核関数を用いた回帰平滑化を行う。 ksmooth(x, y, kernel = c("box", "normal"), bandwidth = 0.5, range.x = range(x), n.points = max(100, length(x)), x.points) ↑ 散布図平滑化 LOWESS 平滑化による計算を実行する。 lowess89 は平滑結果の座標である x と y を成分に持つリストを 返す。平滑結果は lines() 関数で元の散布図プロットに描き加えることができる。 lowess(x, y = NULL, f = 2/3, iter=3, delta = 0.01 * diff(range(xy$x[o

    komuku
    komuku 2013/09/11
  • Rの基本パッケージ中の時系列オブジェクト一覧 - RjpWiki

    RjpWiki はオープンソースの統計解析システム R に関する情報交換を目的とした Wiki です時間情報 時系列オブジェクトは(等間隔)観測時間情報を持つため、時間に関する以下のような幾つかの 特殊な情報を持つ: 自然な時間単位 年、月、週、一時間等 観測開始時間 start 観測終了時間 end 頻度 frequency:単位時間内の観測値の数。月別データなら、自然な時間単位 「年」に対する周期は 12 サンプリング比率 deltat: 自然な時間単位に対する、サンプリング間隔を表す比率。 月別データなら、自然な時間単位「年」に対する deltat は 1/12。周 期とサンプリング比率どちらか一方を与えれば良い。 周期 cycle:各データの観測時間情報を表す、自然な時間単位とその中での頻度 を表す対。例えば年と月 (1993、5)、年と四半期 (2002、Qtr2)、月と日

    komuku
    komuku 2013/09/11
  • R-2.1.1(Windows)のインストール方法 - RjpWiki

    RjpWiki はオープンソースの統計解析システム R に関する情報交換を目的とした Wiki です2013-04-17 Rリスト R史 2013-04-15 Q&A (初級者コース)/15 2013-04-14 R で機械学習 2013-04-11 RとWebサービス 2013-04-10 Rがインポート・エクスポートできるデータ形式 2013-04-09 Rでスポーツ統計 トップ頁へのコメント 2013-04-04 RjpWiki 2013-04-03 Rとd3.js 2013-03-30 RでGIS 2013-03-26 Q&A (初級者コース)/14 2013-03-24 Rcmdrの機能 RStudio Shiny 2013-03-19 日語化掲示板 R でエンタメ 2013-03-14 R掲示板 追加パッケージをなんでもかんでも追加する 2013-03-10 R のインスト

    komuku
    komuku 2013/08/27
    『表示とカーソル位置がずれていく問題』『.フォントでMS-Gothicを選ぶと問題が解決しました.』
  • R: Fitting Gaussian peaks to density plot data using nls

    komuku
    komuku 2013/08/02
  • Rでtar.gz形式のパッケージをWindowsにインストールする。 - Analyze IT.

    RにSLmiscというパッケージをインストールしようとしたら既にCRANから削除されていた。 でもって、ARCHIVEからパッケージをダウンロードしようと思っても.tar.gz形式しか存在せず… で、それをインストールするのにちょっと苦労しちゃったのでメモ。 ちなみにSLmiscのアーカイブは以下のリンクに存在します。 ftp://cran.r-project.org/pub/R/src/contrib/Archive/SLmisc/ やることは簡単。コマンドプロンプトからインストールするだけ。 事前準備は3つ。 Rの実行ファイルにパスを通しておく。 Perlのインストールをしてパスを通しておく。 でもって、C:\Rというフォルダにインストールしたいパッケージを保存しておく。 その後は簡単、以下のコマンドを実行するだけ。 R CMD INSTALL [インストールしたいパッケージ]

    Rでtar.gz形式のパッケージをWindowsにインストールする。 - Analyze IT.
    komuku
    komuku 2012/12/04
  • Rと時系列(3)

    で表現するモデルを自己回帰条件付き分散不均一(ARCH: AutoRegressive Conditional Heteroscedastic) モデルと呼び、通常ARCHモデルと呼ぶ。式の中のωは定数である。 さらに、ARCHモデルを次のように拡張したものをGARCH(Generalized ARCH)モデルと呼ぶ。 また、条件付き分散の非対称性を表すTGARCH(Threshold GARCH)モデル、GARCHモデルとTGARCHモデルを統合したAPARCH(Asymmetric Power ARCH)モデルも提案されている[1][2][3]。 パッケージtseries、fSeriesにはこれらのモデルに関連する関数が用意されている。これらのパッケージは、いずれもCRANミラサイトからダウンロードできる。パッケージtseriesには、GARCHモデルを当てはめる関数garchが

    komuku
    komuku 2012/11/14
  • Rと時系列(2)

    回帰分析と同様に時系列データ解析の主要な目的は、収集したデータを用いてモデルを作成し、将来の予測やシステムの制御などを行うことである。 時系列データのモデルは で表現でき、かつ|a|=1(単位根)である場合、ランダムウォークと呼ばれる。ランダムウォークで表現される時系列データは非定常である。時系列データを分析する際には、まずデータの変動がランダムウォークで表現できるか、そうでないかを調べることが重要である。 時系列がランダムウォークで表現できるか否かを検定することを単位根検定と呼ぶ。単位根検定は「単|a|=1が存在する」という帰無仮説検定で、1970年代後半にDickey-Fullerによって初めて考案され、その後Phillips-Perron検定、McKinnons's検定などが提案されている。 Rには、Phillips-Perron検定に関する関数PP.testがある。データlhの

    komuku
    komuku 2012/11/14
  • Rと時系列(1)

    時間とともに変動する現象に対して時間の順序で測定・観測した結果の記録を時系列データと言い、略して時系列(time series)と言う。時系列データは多くの分野で様々な目的で取り扱われる。日常の社会生活の中でよく見受けられるものには、心電図や脳波のような医療データ、気温や気圧のような気象データ、株価および為替レートのような金融・経済データなどがある。 時系列データは、常に変動を伴うものである。その振る舞いを統計的に分析し、データ変動の特徴を捉え、現象の解明と将来の変動を予測・制御しようとするのが時系列データ分析の主要な目的である。 ちなみに、2003年ノーベル経済学賞の受賞の対象となった内容は、経済時系列分析に関するものである。

    komuku
    komuku 2012/11/14
  • Introduction to Computer-Intensive Methods of Data Analysis in Biology - 根なし草、ついにブログに根付くのか

    komuku
    komuku 2012/05/01
  • Rの作業ディレクトリの変更をしたい! - 捨てる神あれば拾う神あり

    R起動毎に設定する方法方法1.R Consoleのメニューバーから[ファイル]→[ディレクトリの変更…]から変える。方法2.getwd()とsetwd()を使って変更する。コンソールにgetwd()と入力して、現在の作業ディレクトリを表示させるsetwd()で変更したいディレクトリを引数とする。ここでは、デフォルトの作業ディレクトリをマイドキュメント。変更したい作業ディレクトリをD:/R作業ディレクトリとしている。詳細は下の画像を参照のこと。恒久的に設定する方法デスクトップ上にあるRのアイコンを右クリックして「作業フォルダ」の欄を変更したい場所に変える。恒久的に設定する方法が書かれているが見つからなかったので、一応念のため書いておきました。これが一番素朴な解決法でした(^-^;

    komuku
    komuku 2012/03/15
    作業ディレクトリを恒久的に設定する方法
  • Momma's Wiki: R/アップグレード - パッケージそのままRをアップグレード 最新のRを入手してインストール / ...

    komuku
    komuku 2012/03/13
  • Excel上でRを動かすRExcel - もうカツ丼でいいよな

    最近Office Professionalを買ったので,近頃はもっぱらOfficeで遊んでいる.Officeはちょっとバグとか多くて難しいから,よく勉強をして早く初心者を脱出したい. で,ここ2〜3日はExcelからRを呼ぶ方法をいろいろ調べていた.やっぱVBAちょっとくらい勉強しないと駄目かなとか思い始めた頃,RExcelというExcelのアドインを見つけた(statconn).これを使うと結構実用的なレベルでExcelとRを連携させられそう*1. RExcelのインストール まず,rscproxyとrcomの2つのパッケージをRから入れておく.下の二行はRExcelのインストール時にやれっていわれたからやった*2. install.packages("rscproxy") install.packages("rcom") library(rcom) comRegisterRegistr

    Excel上でRを動かすRExcel - もうカツ丼でいいよな
    komuku
    komuku 2012/03/13
    面白そう。
  • 割合データ,二値データをGLMで解析する 山口 典之(立教大・理・生命理学) 鳥屋の皆さんがよく出会うデータ構造 割合データ ・性比(雄数/全個体数) ・けんかの勝率(勝ち数/闘争��

    割合データ,二値データをGLMで解析する 山口 典之(立教大・理・生命理学) 鳥屋の皆さんがよく出会うデータ構造 割合データ ・性比(雄数/全個体数) ・けんかの勝率(勝ち数/闘争回数) ・孵化率(未孵化卵数/クラッチサイズ) ・成幼比(成鳥数/全個体数) 従属変数が割合データのときに生じる問題 ・分母値が一定でない場合,データ点の重みが異なる. 二回コイントスして一回表という試行 (1/2=0.5) 百回コイントスして五十回表という試行(50/100=0.5) どちらもデータとしては0.5だが,重み (0.5であるという確からしさ)が異なる. 従属変数が割合データのときに生じる問題 ・誤差が正規分布しない(二項分布) ・等分散ではない(σ2=npq) ・従属変数に上限下限がある(0 ≤ y ≤ 1) ・しばしばoverdispersion(過分散)が  生じる 普通に回帰できない 割合

    komuku
    komuku 2012/01/24
  • R help - Overlay plots from different data sets using the Lattice package

    komuku
    komuku 2011/10/27
  • R: latticeのグラフの重ね合わせ: Taglibro de H

    lattice系のグラフを重ね合わせるには、library(latticeExtra)のas.layer()を使用する。 こういうコード library(lattice) library(latticeExtra) ## surface x <- seq(0, 2, length = 100) y <- seq(0, 2, length = 100) grid <- expand.grid(x = x, y = y) grid$z <- grid$x + exp(grid$y) - grid$y ## points px <- seq(0.25, 1.75, length = 7) py <- seq(0.25, 1.75, length = 7) pnt <- expand.grid(x = px, y = py) ## graph margin <- 0.05 lvp <- level

    R: latticeのグラフの重ね合わせ: Taglibro de H
    komuku
    komuku 2011/10/27
  • 1