タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

決定木に関するchezouのブックマーク (3)

  • データマイニングと機械学習

    1 データマイニングと機械学習 櫻井彰人 慶應義塾大学理工学部 管理工学科 データと情報 � 現代社会は大量のデータを産出する � データ源: ビジネス、研究、医療、経済、地理、 環境、スポーツ、、、、 � 潜在的に価値有るデータ源、しかし、 � 生データは役立たない: 自動的に情報を 抽出する技術が必須 � データ: 記録された事実 � 情報: データに隠された規則性 情報が必須 � 例1: 体外受精 � 所与: 胚の60の特徴量 � 課題: 生存する胚の選択 � データ: 胚と結果の履歴 � 例2: 牛の間引き � 所与: 牛の700の特徴量 � 課題: 間引きすべき牛の選択 � データ: 牛と農場主の判断の履歴 データマイニング � 隠れた、これまでは知られていない、潜在的に重 要な情報を、データから抽出する � 必要: データ内のパターンや規則性を抽出する プログラム � 明確なパ

    chezou
    chezou 2016/03/22
  • Code Craft House

    その昔、画像から人のポーズ推定ができたら、ピクトさんの画像が大量に作れるなーと考えたことがありました。当時は諦めましたが、ここ最近のDeep Learning技術の発展で実現の可能性が出てきました。少し前に Realtime Multi-Person Pose EstiamtionのChainer実装 が公開されていたので、ありがたく使わせてもらって、「写真からピクトさんを生成する」をやってみます。なお、この記事の環境構築から後の部分はJupyter Notebookでそのまま動くようにしてあるので、興味を持たれた方はそのままコピペして実行して見てください。

    chezou
    chezou 2016/03/16
  • scikit.learn手法徹底比較! 決定木編 - Risky Dune

    今回は決定木を用いて手書き文字データの分類を行う. 決定木の詳細はあらゆる所で解説されているので適当に調べて欲しい. このPDFを参考にしたけど, いい資料かは微妙. 決定木は各節に質問が, 葉にクラスラベルが結び付けられている木(データ構造の木)である. 各節では入力ベクトルのある次元の値に関する質問があり(ex. 入力ベクトルの1次元目は5以上か?), 新たなデータを分類する際は, その質問に対する答えによって, データはその節の左右に振り分けられる. それを再帰的に繰り返すと, データは各葉に振り分けられ, そのデータのクラスラベルは, 葉に割り当てられたクラスラベルになる. 学習段階では, その木の形と節に割り当てる質問を探索する. どのような質問がいいかは, その質問によるデータ集合の不純度(Impurity)の変化によって判断する. 不純度は確率変数の分布に対して割り当てられる

    scikit.learn手法徹底比較! 決定木編 - Risky Dune
    chezou
    chezou 2016/03/16
  • 1