タグ

統計に関するkote2kote2のブックマーク (14)

  • 統計の問題を Python で実際に計算してみる - Qiita

    プレジデントオンラインに統計の記事が掲載されていました。 朝や出社時間と、営業成績に「相関関係」はあるか? http://president.jp/articles/-/12416 上記の記事では確かに数式は出てこないのでとっつきやすく解説は詳しいので統計の入門にはピッタリです。しかしながらエクセルで手計算することが前提になっておりこれは若干億劫です。 そこで今まで利用してきた Python でこれらの問題を計算してみたいと思います。 問題とその解法 問題の内容としては各社員の、朝べてきた確率 (= 朝率) 、出社時間、それに対して営業成績を 3 つの変数として相関関係があるか調べるというものです。このように変数の間の相関関係を調べるというのはさまざまな統計の基とも言えるでしょう。 計算機で扱えるように、それぞれの変数を X Y Z としましょう。まずはこれをCSV ファイルの

    統計の問題を Python で実際に計算してみる - Qiita
  • Python pandas プロット機能を使いこなす - StatsFragments

    pandas は可視化のための API を提供しており、折れ線グラフ、棒グラフといった基的なプロットを簡易な API で利用することができる。一般的な使い方は公式ドキュメントに記載がある。 Visualization — pandas 0.17.1 documentation これらの機能は matplotlib に対する 薄い wrapper によって提供されている。ここでは pandas 側で一処理を加えることによって、ドキュメントに記載されているプロットより少し凝った出力を得る方法を書きたい。 補足 サンプルデータに対する見せ方として不適切なものがあるが、プロットの例ということでご容赦ください。 パッケージのインポート import matplotlib.pyplot as plt plt.style.use('ggplot') import matplotlib as mpl m

    Python pandas プロット機能を使いこなす - StatsFragments
  • ビジネス実務の現場で有用な統計学・機械学習・データマイニング及びその他のデータ分析手法10+2選(2016年版) - 渋谷駅前で働くデータサイエンティストのブログ

    そう言えば3年前にこんなまとめ的エントリを書いたのでした。この内容はそのままかなりの部分が2年前に刊行した拙著の原案にもなったということで、色々思い出深いエントリです。 なのですが。・・・この3年の間に統計学・機械学習・データマイニングの諸手法及びそれを取り巻くビジネスニーズには様々な進歩があり、そろそろこの内容にも陳腐化が目立つようになってきました。ということで、3年間の進歩を反映してアップデートした記事を書いてみようと思います。前回は「10選」でしたが、今回は「10+2選」に改めました。そのラインナップは以下の通り。 統計学的検定(t検定・カイ二乗検定・ANOVAなど) t検定 カイ二乗検定 ANOVA(分散分析) その他の検定 重回帰分析(線形回帰モデル) 一般化線形モデル(GLM:ロジスティック回帰・ポアソン回帰など) ロジスティック回帰 ポアソン回帰 正則化(L1 / L2ノルム

    ビジネス実務の現場で有用な統計学・機械学習・データマイニング及びその他のデータ分析手法10+2選(2016年版) - 渋谷駅前で働くデータサイエンティストのブログ
  • R vs Python:データ解析を比較 | POSTD

    主観的な観点からPythonとRの比較した記事は山ほどあります。それらに私たちの意見を追加する形でこの記事を書きますが、今回はこの2つの言語をより客観的な目線で見ていきたいと思います。PythonとRを比較をしていき、同じ結果を引き出すためにはそれぞれどんなコードが必要なのかを提示していきます。こうすることで、推測ではなく、それぞれの言語の強みと弱みの両者をしっかりと理解できます。 Dataquest では、PythonとRの両方の言語のレッスンを行っていますが、データサイエンスのツールキットの中では両者ともそれぞれに適所があります。 この記事では、NBA選手の2013/2014年シーズンの活躍を分析したデータセットを解析していきます。ファイルは ここ からダウンロードしてください。解析はまずPythonとRのコードを示してから、その後に2つの異なるアプローチを解説し議論していきます。つま

    R vs Python:データ解析を比較 | POSTD
  • 提案書や企画書づくりが驚くほど捗る!無料で入手出来る統計データ総まとめ。

    プロジェクトを開始する前に、市場調査などで統計データを分析し仮説をたてる事は重要ですが、それらの調査対象が世界規模、全国規模になるとコストが掛かりすぎて(特に個人や中小企業の場合)現実的ではありません。 そこで活用したいのが国や団体、民間企業が公開している無料の統計データです。今日はそんなマーケティング担当者ならきっと必見の情報公開を行なっているサイトをご紹介します。 1. 総務省統計局 総務省統計局では様々な統計データが入手可能です。 国税調査 人口推計 労働力調査 小売物価統計調査 土地統計調査 このようなデータはPDF版が一般的ですがExcel形式でダウンロードできるのも魅力ですね。その他にも以下URLより数多くの統計データが入手できます。 また、統計局ではメール配信サービスも行なっています。興味のある方は登録をおすすめします。 www.stat.go.jp 2. 法務省 法務省でも

    提案書や企画書づくりが驚くほど捗る!無料で入手出来る統計データ総まとめ。
  • 統計データ・市場調査データを提供するサービス11選

    業界の市場動向を調べる際に、皆さんはどのように根拠データを入手していますか?自社のホームページに新規コンテンツを立ち上げたい時、どの方向に展開をしていけばそのマーケットを押さえることができるでしょうか。これらを解決するのが、Web上で閲覧できる統計や調査データの数々です。各企業が自社で調査した数値を公開しているものもあれば、国が統計データとして公開しているものもあります。 今回は調査や統計データを入手できるサイト、調査機関のサイトをまとめました。皆さんのビジネスにお役立てください。 ※データの引用や利用にあたり制限がある場合があります。詳しくは各サイトの利用規約などをご確認ください。 統計データや市場調査データが公開されているサービスまとめ 総務省統計局 http://www.stat.go.jp/ 今回紹介する中では最も利用され、また目にする機会も多い調査の一つかもしれません。総

    統計データ・市場調査データを提供するサービス11選
  • 統計局の公式アプリ『アプリDe統計』がちょっとデータがほしい時にかなり便利そう - Play Forward

    ビジネスパーソンが資料作りなどで客観性を高くするために必要になってくる統計情報ですが、なかなかデータを探すのは面倒なもの。そこで統計局がお手軽に統計情報が分かるアプリをリリースしたので少し使ってみたのですが、これがちょっとしたデータがほしい時にかなり便利な優良アプリでした。 ◆ちょっとデータがほしい時にかなり便利な『アプリDe統計』 統計局の公認アプリというだけあって、統計局ホームページで探さなければゲットできないような統計情報がカンタンに分かります。 アプリを起動すると、地域ごとの統計情報、または日にまつわる各種統計情報の2つを選択します。 ◆エリア別に統計情報がゲットできる 地域ごとの情報では、都道府県別にそれぞれ統計情報を入手できます。スマホアプリなのでGPS機能で現在地の市区町村データも分かるのが便利なところです。 例えば、目黒区だとこんな統計情報になっているようです。企業活動数

    統計局の公式アプリ『アプリDe統計』がちょっとデータがほしい時にかなり便利そう - Play Forward
  • 1万件以上のイベントをサポートしてきて学んだ教訓 | Doorkeeper

    Paul McMahon Doorkeeperを使って開催されたイベントは、1万件を超えています。 この経験から、どのようなイベントが成功しそうか、というデータが集まりました。ここで、私たちのプラットフォーム上で主催されたイベントの数々から学んだことを、見てみましょう。 イベントの成功のためには、様々な要素を検証する必要がありますが、Doorkeeperのデータによると、下記のとおり、と、胸を張ってお答えできるのです。 どうやって、イベント参加申込者を増やすのか? イベント参加申し込みをした人を、どうやって実際に来場させるのか? こちらを念頭に置いて、下記の私たちの学んだ教訓について、見てみましょう。 イベントについて、詳しいお知らせをすることで、参加登録者を増やしましょう イベントに参加してくれそうな人には、イベントの詳細をお知らせして、申し込みにつなげましょう。 イベントの申し込み率と

    1万件以上のイベントをサポートしてきて学んだ教訓 | Doorkeeper
  • 世界最高の選手リオネル・メッシの何がすごいのかが統計的データ分析で明らかに

    ネイト・シルバー氏といえば、米大統領選の勝敗を全50州分的中させたり、野球選手の成績を予測するための統計ツールPECOTAを開発した人物として知られる天才データアナリストです。そんなネイト・シルバー氏が新しく立ち上げた、統計を使ってあらゆる事象を分析するニュースサイトがFiveThirtyEightで、ここでスポーツ関連のデータアナリスト兼ライターを務めるBenjamin Morrisさんが現在世界ナンバーワンのサッカー選手と目されているリオネル・メッシ選手に関するさまざまなデータを分析しまくったところ、メッシ選手は通常ではほとんど不可能な要素を両立しまくったまさにミラクルな選手であることが判明しました。 Lionel Messi Is Impossible | FiveThirtyEight http://fivethirtyeight.com/features/lionel-messi

    世界最高の選手リオネル・メッシの何がすごいのかが統計的データ分析で明らかに
  • 放送大学 - REDIRECT

    当サイトは移転しました。10秒後に以下のURLにリダイレクトします。 自動でリダイレクトされない場合、以下のリンクから移動してください。 https://info.ouj.ac.jp/~suuri/_webTohkei/ キャンパスネットワークホームページは教務情報システム(システムWAKABA)に統合されました。 上記に伴い「www.campus.ouj.ac.jp」ドメイン上の各サイトは「info.ouj.ac.jp」に移行されました。 2019 The Open University of Japan

  • 総務省|報道資料|「平成25年度 青少年のインターネット・リテラシー指標等」の公表

    総務省では、青少年のインターネット・リテラシーに関する実態調査を実施し、結果概要を「平成25年度 青少年のインターネット・リテラシー指標等」として取りまとめましたので、公表します。 総務省では平成23年度、インターネット・リテラシー向上施策の重要性に鑑み、今後同施策を効果的に進めていくために、青少年のインターネット・リテラシーを可視化するテスト等を開発しました。 今年度は昨年度に引き続き青少年のインターネット・リテラシーを測るテストを、全国の高等学校1年生相当(約3500名)に対し、アンケートと共に行い、結果を集計・分析して青少年のインターネット・リテラシーの実態を明らかにし、「平成25年度 青少年のインターネット・リテラシー指標等」として、別添のとおり取りまとめました。 ・ 青少年全体の正答率は69%と昨年度(67%)より2ポイント上昇。 ・ スマートフォン保有者は全体の84%と昨年度(

    総務省|報道資料|「平成25年度 青少年のインターネット・リテラシー指標等」の公表
  • 「高一スマホ保有率84%」の衝撃(不破雷蔵) - エキスパート - Yahoo!ニュース

    「84%」は大げさな値では無い先日総務省が発表した「青少年のインターネット・リテラシー指標など」では、2013年6月から7月にかけて高校一年生を対象に行った、インターネット関連の各調査結果が明らかにされている。その中でも目を留めたのは「スマートフォンの保有率」(厳密には「保有するインターネット接続機器」)が84%という値である。 ↑ 保有するインターネット接続機器(複数回答)調査期間、そして調査方法(インターネット経由に寄るものでは無い)を見るに、ほぼ高一全体の現状を示していると考えて良い。「保有」に関する詳しい定義の説明は無いため、「所有権・使用権合わせて人保有」以外に「兄弟・家族との共用」「所有権は保護者にあるが、借り受けて使っている」などのパターンがありうるが、ともあれ「自分で保有している」と自称できるほどの頻度で使えるスマートフォンが手元にあることに違いは無い。 元々類似の他調査

    「高一スマホ保有率84%」の衝撃(不破雷蔵) - エキスパート - Yahoo!ニュース
  • 国勢調査など政府統計データをCSV化してダウンロードできる「統計くん」 政府API活用

    個人開発者の矢野さとるさんは6月12日、10日に公開された「次世代統計利用システム」のAPIを活用し、国勢調査などの政府が持つ統計データをCSV形式でダウンロードできるWebサービス「統計くん」を公開した。 次世代統計利用システムは、統計のオープンデータの高度化に向け、統計センターが総務省統計局と協力して提供しているシステム。政府の統計ポータル「e-Stat」でデータベース化されている統計データを、XMLやJSONなどで出力するREST方式のAPIを提供している。 統計くんは同APIを活用し、国勢調査、事業所・企業統計調査、全国物価統計調査、家計消費状況調査などについて、調査結果をWebブラウザ上に表示したり、条件を絞り込んで分類したり、CSV化してダウンロード可能。今後は、グラフ生成やクロス集計機能などの実装を検討している。 関連記事 「PM2.5まとめ」正式公開 現在地のPM2.5濃度

    国勢調査など政府統計データをCSV化してダウンロードできる「統計くん」 政府API活用
  • 少しの手間で説得力アップ!意外と使える官公庁の統計データ利用法 : LINE Corporation ディレクターブログ

    こんにちは、ウェブサービス部の鳴海です。 突然ですが、あなたが24歳男性だったとすると、同い年の年男は日全国で何人いるでしょう? また36歳男性には、同じく年男の同級生は何人いるでしょうか? 答えは、24歳男性が64万人、36歳男性が87万人。実は、世代間で20万人以上の差があります。また、今年の年男・年女世代の中で、最も人口の少ない12歳女性(57万人)と最も人口の多い48歳男性(89万人)では1.5倍以上の開きがあります。最近、身の回りに小学生の女の子よりも中年男性の方が多いなと思っていましたが、気のせいではなかったようです。 同級生の人口なんて普段意識することはないですが、仕事をする上ではたまに大事だったりします。いま自分が手がけているサービスのターゲットはどの層で、人口で言えばどのくらいの規模なのか、前後の世代に比べてどのような傾向があるのかなどは感覚的に掴めているといいですね

    少しの手間で説得力アップ!意外と使える官公庁の統計データ利用法 : LINE Corporation ディレクターブログ
  • 1