この記事はR Advent Calendar 2018 15日目の記事です。 今回は、平成も終わるのでロバスト統計の話をしますね。(異論は受け付けない) 外れ値 何かしらの実験やデータを取った際に、分布を確認すると思います。 そんな時に、いくつかおかしなところにplotされてしまう何かがあるケース、よく出くわしますよね。 他のデータよりも明らかにおかしな値を取っているものを外れ値(Outlier)と言います。 具体的には下記のようなイメージです。 これを元に要約統計量などを算出しようとすると、外れ値の持つ値に引きずられて平均値などの代表値は信頼性を担保できなくなる可能性があります。 ロバスト統計とは 先ほど説明した外れ値の混入は未然に防ぐことができれば良いですね。しかし、データ取得の前に防げば良いのですが、なかなか思うようにうまくはいきません。サービスをリリースしたりすると、想定していなか
Practical R Package Development (Japanese) Hiroaki Yutani 2019-02-11 はじめに Rのパッケージ開発については「R Packages」(Hadley Wickham、2015)に詳しいが、Rのパッケージ開発にはここ数年で様々な変化があった。 幸い、同書は第2版に向けて大幅に書き直される予定1なので、賢明なRパッケージ開発者はそれを待つのがいいだろう。本書は、あくまでもそれまでのつなぎのような存在として、むしろ筆者のメモ代わりとして、衝動的に書き殴られたものだ。Rパッケージ開発の基礎はすっとばし、新たなトピックを中心に取り扱う。信用がおける知識についてはあくまでも「R Packages」を参照されたい。
要約 drakeパッケージは、GNU makeのようにあらかじめ定義されたワークフローを自動的に実施する仕組みを、Rユーザに馴染みやすいデータフレーム形式で提供する ワークフローの構築と管理、実行はRの関数として提供され、依存関係を可視化する関数も用意される drakeパッケージを使うことで、データ分析でありがちな「再実行」の負担(再計算、コードの保守)を軽減することが可能となる 各オブジェクトは自動的にキャッシュされ、コードや依存関係に変更のない場合はキャッシュが利用される ワークフローの各処理の状況、依存関係を可視化する関数も用意され、ワークフロー管理が容易になる 要約 はじめに シーシュポスの岩 既存の解決策 drake: Rユーザのためのワークフロー処理パッケージ ワークフロー管理の基礎 ワークフローと依存関係の可視化 ワークフローの変更 参考URL はじめに データ分析の作業は、
まずはTwitterでこの記事をシェアする author: Unadon (見習い飯炊き兵) 動作環境:Mac OS Sierra 10.12.1; R version3.3.1; rstan 2.10.1 はじめに Rを使う時、私はわざわざ表など使わず、”head(data)”なんかでデータの確認を済ませてしまったりすることが多いです。 でも、他人と共有するとなると、見せ方を考えなければならない。それで、面倒だけどエクセルにコピペして…とやっていました。 また、Rのコンソールに収まりきれないデータを確認したいときなども、何らかの手立てを考える必要があるとおもいます。 今回は、そんなデータの確認に使える”表の出力”についてまとめていきます。 本稿のお品書き package{DT}: dataframeをHTMLの表に一発変換(データが大きい場合有用) package{knitr}: dat
こんにちは。ホクソエムのグローバル推進事業部にて本部長を努めます瓜生(@u_ribo)です。この記事ではRにおける環境変数の設定方法のおさらいと、ナウな手法を使った環境変数の管理方法について紹介します。 環境変数を利用していますか? Rでは、利用している環境やユーザの設定を環境変数として記録・利用できるようになっています。具体的な項目についてはドキュメントに記されている通りですが、例えばユーザのホームディレクトリ (HOME)やロケール (LC_ALL)などがあります。こうした環境変数は直接意識して利用することは稀ですが、頻繁に使う値やディレクトリのパスなどを環境変数として保存しておくと便利なことがあります。 現在設定されている環境変数の値を確認するにはSys.getenv()関数を実行します。引数に何も指定せずに実行すると全ての環境変数と値が出力されますが、引数に環境変数名を指定すること
The table below shows my favorite go-to R packages for data import, wrangling, visualization and analysis — plus a few miscellaneous tasks tossed in. The package names in the table are clickable if you want more information. To find out more about a package once you’ve installed it, type help(package = "packagename") in your R console (of course substituting the actual package name ). My favorite
flexdashboard本格入門 前田和寛(kazutan) 2017年12月16日 はじめに 自己紹介 前田 和寛 比治山大学短期大学部 @kazutan twitter GitHub Qiita Kazutan.R Rおじさん こんなことしてます 今日のお話 flexdashboardの本格入門 特徴と導入 hello, dashboard! 全体設定(yaml部分) ダッシュボードレイアウト 構成要素 応用技 Shinyの利用 デプロイ(公開) 留意事項 flaxdashboardとは rmarkdownでダッシュボード作成 rmarkdownのテンプレートパッケージ 単一のRmdファイルからダッシュボード生成 基本的な作り方は一緒 単一ファイルで出力 self_contained: trueでhtmlファイルにまとめられる でもタブ機能やメニュー機能もある レイアウト調整・テーマ
Transcript mlrパッケージによる 機械学習実践⼊⾨ TokyoR #59 2017/3/18 Twitter ID:Keiku ⾃⼰紹介 • さまざまな領域でデータサイエンスによるコンサルティ ングをしています • 趣味でKaggleをやっています。Kaggle Masterです。 • KDDCup2015 6th Prize • Kaggle - Airbnb New User Bookings Challenge 2nd Prize データサイエンティスト養成読本 ొཽฤ発売 • データサイエンスビギナー向け (最低限の基礎知識を完全網羅し た240ページ!) • @gepuro、@piroyoung、 @forestython、@ksmznなど、 多数の次世代のRおじさんを担う 若⼿が参画 • 3/25発売(⼤型書店で⼀部先⾏ 販売!) • 私は「11章 機械学習超⼊⾨
A Brief Introduction to caretEnsemble Zach Deane-Mayer 2024-09-12 caretEnsemble is a package for making ensembles of caret models. You should already be somewhat familiar with the caret package before trying out caretEnsemble. caretEnsemble has 3 primary functions: caretList, caretEnsemble and caretStack. caretList is used to build lists of caret models on the same training data, with the same re-
Thousands of teams worldwide trust MyGet with their package management and governance NuGet is the defacto open platform for sharing finished code packages with .NET developers around the world. From DLLs to other content needed in the projects that consume these packages, the Microsoft-supported mechanism for sharing code is NuGet, which defines how packages for .NET are created, hosted, and cons
親愛なるシリアルパッケージクリエイターのみなさま、ごきげんよう(キュアホクソエムです)。一人前のシリパクになるべく修行中です。Rパッケージを作成する際に避けては通れない(必ず作成する必要がある、mandatoryな)DESCRIPTIONファイルについて今更ながら調べてみました。 @yutannihilationさんが書いてくださいました。実際、このEncodingはreadrでも使われています。 コード内に日本語を含むパッケージはDESCRIPTIONにEncode:UTF-8って書いとかないといけないっぽい - Technically, technophobic. DESCRIPTIONファイルとは何か Writing R Extensionsの内容からざっくり引っ張ってくるとこんな感じ。 DESCRIPTIONファイルはパッケージについての簡単な情報を含む 統一されたフォーマット(D
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く