タグ

自然言語処理に関するtomityのブックマーク (6)

  • HOME

    GETAssoc GETAssocは、国立情報学研究所高野研究室で開発された連想検索エンジンです。 特長 高速な文書検索 HTTPインターフェースのサポート 複数データベース間の横断検索が可能 複数CPU対応による負荷分散 インデックスの差分更新対応 検索インデックスの構築が容易 任意の類似度尺度が記述可能 オープンソース News 2009/09/04 GETAssoc 1.1 をリリースしました。 2009/07/21 GETAssoc 1.0 をリリースしました。 ダウンロード GETAssocはフリーソフトウェアです。修正BSDライセンス(Revised BSD License, 宣伝条項無し)に従ってソフトウェアを使用、再配布することができます。 stmd-1.1.5.tar.gz getassoc-1.1.5.tar.gz getassoc-1.1.0.zip (Window

  • DO++: 機械学習による自然言語処理チュートリアル

    自然言語処理のときに使う機械学習手法のテクニックをざーっと2時間程度で紹介してほしいとのことだったので今日話してきました。基的に、そんなに頑張らなくても効果が大きいものを中心に説明(特にパーセプトロンとか)を説明してます。 紹介した手法はパーセプトロン、最大エントロピー、正則化、多クラス分類、系列分類(CRF, Structured Perceptron)などなどです。どれも一かじりする感じで網羅的に見る方を優先してます。個々の詳しい話はそれぞれの文献や実装などを当たってみてください。 スライド [ppt] [pdf] ここで話しているのは線形識別モデルの教師有り学習が中心で教師無し学習(クラスタリングなど)など他の自然言語処理を支える技術は省いてます。 こういうのを使って(使わなくてもいいけど)どんどんアプリケーション作らないといかんね。 Tarot is not used to ma

    DO++: 機械学習による自然言語処理チュートリアル
  • FrontPage - 情報論的学習理論と機械学習の「朱鷺の杜Wiki」

    朱鷺の杜Wiki(ときのもり うぃき)† 朱鷺の杜Wikiは,機械学習に関連した,データマイニング,情報理論,計算論的学習理論,統計,統計物理についての情報交換の場です.これら機械学習関係の話題,リンク,関連事項,書籍・論文紹介などの情報を扱います. 更新されたページを確認するにはRSSリーダを使って右下のRSSリンクをチェックするか,最終更新のページを参照してください. ページの中でどこが更新されたかを見るには,上の「差分」をクリックして下さい. 数式の表示に MathJax を利用しています.数式の上でコンテキストメニューを使うと各種の設定が可能です.特に設定をしなくても数式は閲覧できますが,フォントをインストールすれば数式の表示がきれいで高速になります.詳しくは 数式の表示 のページを参照して下さい. ごく簡単なWikiの使い方がこのページの最後にあります.トップページやメニューなど

  • DO++: 自然言語処理の話

    先日、自然言語処理はどのように役に立つのかというので酒の席で討論になりました。 自然言語処理とは、人が日常的に使っている自然言語(コンピュータ言語との対比でそうなってるらしく、日語とか英語とか)をコンピュータに処理させる技術で、様々な技術と問題が融合する境界領域です。純粋な言語理論だけではなく、人工知能やら統計やら何でもまじってます。広義だと情報検索(の基盤といったほうがいいかな)とかも含まれます。 絵とか動画がいくらリッチな情報だとは言え、「昨日私がクーラーかけっぱなしのまま、裸で寝てしまい風邪をひいた」ということを言語情報無しで正確に伝えるのは難しいです。世の中の殆どの情報は自然言語で表されています。 で、自然言語処理が抱える宿命として、人にやらせると、言語処理は、ほぼ100%できてしまうということがあります。難しくないのです。 これは他の学問ではあまり見られないことで、例えば300

    DO++: 自然言語処理の話
  • Sentiment Analysis - 勉強会

    趣旨:評判分析,意見分析などにまつわるテキスト処理全般の話題を勉強します. 日時・場所:毎週月曜.東工大すずかけ台キャンパス. 解説・サーベイ資料: [PDF]. 乾孝司,奥村学. テキスト評価分析の技術とその応用. 情報処理, Vol.48, No.9, pp.995--1000, 2007. [PDF]. 乾孝司,奥村学. テキストを対象とした評価情報の分析に関する研究動向. 自然言語処理, Vol.13, No.3, pp.201-241, 2006. チュートリアルスライド: [PDF], [PPT]. 奥村学,乾孝司. blogマイニングと評判分析. 言語処理学会第12回年次大 会チュートリアル, 2006. 関連書籍: 大塚裕子, 乾孝司, 奥村学. 意見分析エンジン -計算言語学と社会学の接点-. コロナ社, 2007. [書籍情報], 活動記録 勉強会で既に取り上げ

  • 情報抽出を利用した複数文書要約 soft2006.pdf (application/pdf オブジェクト)

  • 1