タグ

統計とデータに関するtonybinのブックマーク (5)

  • データ解析基盤を構築する前に考慮すべきポイント - still deeper

    概要 ここしばらく某社でデータの解析基盤を構築する仕事に携わっています。一からの構築になるので打てる手が多く楽しい一方で、適切な判断を下すのは難しいと実感しています。 解析基盤というのはもちろん解析を行うためのものですので、どう解析を行うかによってどういう基盤を構築していけばよいかが決まります。 ところで、データ(構造や収めているDBなども含めて)というのは寿命の長いもので、初期の設計を間違えてしまうと、その時点で戦略的な敗北は決まってしまいます。その後は運用しながら変更可能なところでゲリラ的に対応していくしか手を打てません。 そのため、実際に構築を行う前に、求められている解析がどのようなものかを十分に吟味した上で、適切なハードウェア、ミドルウェア、データ構造を選択し基盤を構築していくことが大変重要です。 着目すべき点 では解析のどのような点に着目すればよいかというと、私は次の5点を考えて

  • 「ガラスの仮面」休載で「別冊花とゆめ」が急降下…少女・女性向けコミック誌部数動向(2012年7月-9月) - ガベージニュース

    先日まで【社団法人日雑誌協会】が2012年11月2日に発表した、2012年7月から9月分の印刷部数データを元に、いくつかの定期発刊雑誌の動向をグラフ化し、分析した。今回は少女・女性向けコミック誌の雑誌について、グラフ化と状況の把握を試みることにする。なお記事執筆者(不破)は男性で女性誌には疎いことから、数字そのものは別としても、内容分析については的外れなことを述べている可能性もある。その点はあらかじめご了承願いたい。 データの取得場所の解説や、「印刷証明付部数」など文中に登場する用語の説明は、一連の記事まとめ記事【定期更新記事:雑誌印刷証明付部数動向(日雑誌協会)】で説明が行われている。そちらで確認をしてほしい。 まずは少女向けコミック誌。少年向けコミック誌の「週刊少年ジャンプ」の立ち位置に「ちゃお」がついている。これは前回と変わりなし。 「ジャンプ」のように100万部超の世界には届か

    「ガラスの仮面」休載で「別冊花とゆめ」が急降下…少女・女性向けコミック誌部数動向(2012年7月-9月) - ガベージニュース
  • 女子生徒の理系志向の国際比較

    武蔵野大学の藤原千賀教授より,『男女共同参画社会と市民』(武蔵野大学出版会,2012年)を謹呈いただきました。構成のバランスがよく,主要分野について,男女共同参画やジェンダーに関連する統計資料が数多く提示されており,とても参考になります。 http://www.musashino-u.ac.jp/shuppan/books/detail/bookdanjo.html 私がとくに関心を持ったのは,2章の「教育・学習分野の男女共同参画」です。24頁に,大学生の女性比率が専攻分野別に掲げられているのですが,工学は10.6%,理学は25.8%,医科・歯科は33.6%というように,理系の分野では,女子学生が殊に少なくなっています(2004年,『学校基調査』)。 世の中には男女が半々ずついることを考えると,これはすごい偏りといえます。まあ,文系には女子が多く,理系には男子が多いというのは,よく知られ

    女子生徒の理系志向の国際比較
  • 出版物の書店立地条件別での売上変化(2015年)(最新) : ガベージニュース

    最近では住宅地域や地方にある昔ながらの個人営業を中心とした小規模書店が次々に閉店へと追いやられる一方、駅周辺の一等地にある大型書店が盛況を見せている。また近郊部に配された、レンタルショップやゲームソフト販売店などと機能を融合した複合的なエンタメサービス提供ショップ的な書店がよく目に留まるようになった。今回はそれら立地条件により、書店の売上がどのような違いを見せているのか、【出版物の種類別売上の変化(前年比)】でも取り上げた、日販による『出版物販売額の実態』最新版(2015年版)のデータを基に、精査を行うことにした。 まずは立地別の売上高前年比。「SC」とは「ショッピングセンター(Shopping Center)」を指す。「商店街」や「駅前」と比べて、「郊外」の下げ方が無難な線で収まっているのは、いわゆる複合店が郊外に多いからではないかとの推測も成り立つ(これについては後程さらなる分析を加え

    出版物の書店立地条件別での売上変化(2015年)(最新) : ガベージニュース
  • Treasure Data Platform で始めるデータ分析入門 〜8. Data Visualization Patterns 〜 Part.1 - doryokujin's blog

    Treasure Data Intro for Data Enthusiast!! from Takahiro Inoue シリーズではデータ分析を以下の7つのレイヤーに分解し,各々について解説していくものとします。(Slide Shareの資料は常時更新されます。) Data Collection Data Storage Data Management Data Processing Data Processing Design Part.1 Part.2 Part.3 Part.4 Part.5 Part.6 Data Visualization Treasure Viewer, MetricInsights, Tableau Data Visualization Patterns Part.1 Part.2 Part.3 日は「7. Data Visulizations」の全

    Treasure Data Platform で始めるデータ分析入門 〜8. Data Visualization Patterns 〜 Part.1 - doryokujin's blog
  • 1