タグ

関連タグで絞り込む (239)

タグの絞り込みを解除

あとでと日本語に関するdenkenのブックマーク (11)

  • 日本語例文検索 JReK

    語で書かれたウェブ上のテキストを巨大な例文集(コーパス)とみなし、それを検索します。JReK(ジェイレック)は、 日語のウェブページのテキストを 巨大な例文集(コーパス, Corpus)とみなし、 それを検索するサイトです。 日語作文の際に役に立つかと思います。 JReK is a Japanese web corpus search site. It is usefull for learners of Japanese!

  • NEC、トリプルメディアの時代において、ソーシャルメディアへの取り組みを推進するため、「公式アカウント一覧」および「「ソーシャルメディアポリシー」を公開 | 日本電気株式会社 | New

    Accurately conveying Japan, present and future, to the world. Mission Providing trustworthy information that deepens understanding of, and generates interest in, Japan. 世界中で、日に興味を持つ人を増やし、日についての理解を深めるために、私たちは、信頼できる情報を提供します。 Vision Contributing to a better world through the promotion of mutual understanding between Japan and various international communities. 日と世界の相互理解を推進することで、よりよい世界の実現に貢献します。

    NEC、トリプルメディアの時代において、ソーシャルメディアへの取り組みを推進するため、「公式アカウント一覧」および「「ソーシャルメディアポリシー」を公開 | 日本電気株式会社 | New
    denken
    denken 2008/09/17
    「辞書メンテナンス不要で高精度な形態素解析を実現。あらゆる新語に対応。」
  • 漢字が 排除するもの - hituziのブログじゃがー #c 野嵜健秀 2008/06/30 04:07

    ある記事を 紹介します。 「日語から漢字を引算できるか?」(彎曲していく日常) うえの記事は、日語から 漢字を とりのぞこうとするのは、排他的なナショナリズムだという内容です。 こうした主張は、子安宣邦(こやす・のぶくに)『漢字論-不可避の他者』岩波書店に かいてあるはなしです。 わたしは日語表記の問題について 8年まえから かんがえています。わたしの議論は つぎのとおりです。 漢字は、文字表記として ふくざつすぎるために、さまざまな文字弱者を 排除し、抑圧している。 もちろん、漢字を なくせば 文字弱者が いなくなるわけでは もちろんない。だが、おおきく改善することが たくさんある。 わたしが「漢字という障害」という論文で指摘した漢字弱者は、非識字者や識字学習者、盲人、弱視者、ろう者、中途失聴者、読字障害を もつひと、知的障害者、日語学習者です。 そうしたひとたちが文字情報にアク

    漢字が 排除するもの - hituziのブログじゃがー #c 野嵜健秀 2008/06/30 04:07
    denken
    denken 2008/06/30
    多様性をなくすのには反対で、小難しい表現で書かれているために文字弱者からのアクセスが困難だが彼らにとって有益な文書があれば勝手に翻訳すれば良いし、そういう権利が認められるべき。
  • ほんとうにスゴイ論文は日本語で書いても外国で読まれる | 5号館を出て

    私が学生の頃に聞いた話なので、今となっては半世紀も前のことなのかもしれませんが、日の魚類学が世界をリードしていた時代があったのだそうです。その頃は魚類学に限らず、日人が書く科学論文の多くは日語で書かれ、日国内の雑誌に載っていたのだと思います。ところが、世界中の魚類学者、特にアメリカの魚類学者は日の魚類学の成果を読みたくて仕方がなかったようで、なんと日の学術雑誌(「魚類学雑誌」?)がアメリカで翻訳されて流通していたという話を聞きました。 しかし、その他の業界の論文は日語で書いても世界の誰も読んではくれなかったようです。つまり日の科学のレベルが低かった、あるいはほとんど評価されていなかったので、わざわざ翻訳してまでも読んでくれる人がいなかったということなのだと思いますが、すでに何年も前に日語で論文が書かれていたのとほとんど同じ内容の研究成果が外国人の手によって英語で出版され、

    ほんとうにスゴイ論文は日本語で書いても外国で読まれる | 5号館を出て
    denken
    denken 2008/01/24
    コミュニティ内でしか通用しない符牒を織り交ぜて論文を書いたらさらに暗号的価値が上がるな
  • 2007日本語プログラミングコンテスト - 2007日本語プログラミングコンテスト

    2007日語プログラミングコンテスト * ようこそ! 日語プログラミングコンテストのWebサイトへ! 日語プログラミング言語の普及と活性化のために、 合同主催のプログラミングコンテストを開催します。 2007年の最後、盛大に日語プログラミング言語を盛り上げましょう! ↑ 表彰式について * 開催日時 4月18日(金)  表彰式 15:00-17:30 懇親会 18:00〜 場所 表彰式 明治大学 駿河台キャンパス リバティタワー15階の1156教室 アクセス 懇親会 台北風情 参加の手続き 参加を希望される場合は、事前にメールで下記にお知らせください。 jp-procon2007-info あっと yahoogroups どっと jp 上記アドレスの[あっと]と[どっと]を記号に置き換えたもの メールには、氏名およびハンドルネーム、年齢、職業などをお書きください。 会場の都合

  • Google Japan Blog: 大規模日本語 n-gram データの公開

    突然ですが、穴埋めクイズです。下線部に入る単語はなんでしょう? グーグルで_____ おそらく、「検索」「調べる」「探す」といった単語を思いつくのではないでしょうか? 実際に、Webにあるドキュメントをくまなく調べ、「グーグルで」の後にくる単語を調べると、「検索」が1位であるとがわかります。 一般に、直前の(N-1)個の単語を見て、次の単語を予測するモデルをN-gram言語モデルといいます。さきほどは、「グーグル」 と 「で」の2単語から次を予想しているので、3-gram言語モデルの例となります。現時点の単語が、直前の(N-1)個のみに影響を受けるという仮説は、一見現実離れしているようですが、実際には非常に有効な場合も多く、かな漢字変換、OCRのエラー訂正、機械翻訳、音声認識などに広く用いられています。たとえば、音声認識の場合、ノイズ等で現時点の単語をシステムが聞き取れなくても、言語モデル

    Google Japan Blog: 大規模日本語 n-gram データの公開
  • エブログ JavaScript で形態素解析もどき

    JavaScript形態素解析もどき JavaScript形態素解析のようなものを。 totonの日記 - すべての漢字を取り出す正規表現 「すべての漢字を取り出す正規表現」をPHPで試す:phpspot開発日誌 これらの記事を参考にして JavaScript で漢字、ひらがな、カタカナ、英数字に区切ることをしています。 ただ、文字コード的にちゃんとできるのか、よくわかりません。Seesaa はShift_jis なのでおかしくなる場合もあるかも知れないです。 下のテキストエリアに文章を入力して解析ボタンを押すと解析結果が表示されます。解析というか、単純に改行で区切っているだけですが。 サンプルは青空文庫の太宰治 走れメロスの冒頭部分。 メロスは激怒した。必ず、かの邪智暴虐(じゃちぼうぎゃく)の王を除かなければならぬと決意した。メロスには政治がわからぬ。メロスは、村の牧人である。笛

    エブログ JavaScript で形態素解析もどき
  • 正確な文章の書き方

    このページでは、正確な文章を書くための秘訣をまとめてみようと思います。それほど文章がうまいとはいえない私が、文章の書き方について述べるのですから、むこうみずな行為であることは百も承知です。しかし、数年に渡って探求した正確な文章の書き方が、少しでもみなさんの役に立てばという思いを自分への励ましに代えて筆をとります。 ここでお話するのは、「文章をいかに正確に書くか」や「自分の考えをどうやったら適切に表現できるか」であって、決して「どうやったら人を感動させる名文句が書けるのか」ではありません。 このページを読んだら「科学技術文献」を書くための技術が少しは身に付くのではないかと期待しています。しかし、 人はいさ 心も知らず ふるさとは 花ぞ昔の 香ににほひける (紀貫之) などのような心に残る文章が頭に浮かぶようになるわけではありません。 絵の書き方に例えて言うなら、ここで述べる内容は、色彩や調和

  • 正しい日本語なんて無いんじゃない - mizuno_takaakiの日記

    「今日の悪文と不正確発音」というまぐまぐから発行されているメールマガジンがありまして、拙作「Web検索エンジンGoogleの謎(asin:488166395X)」が取り上げられていましたよ。 水野貴明(2004)著、「Web検索エンジンGoogleの謎」 で「頻繁にデータを更新すべき」⇒「すべし」 「べし」の終止形を「べき」とする誤りは非常に一般化しており、 正しく「べし」と使っている例は珍しい。 そのわけは、この言葉「べし」は文語なので、 敗戦前の旧仮名遣い時代の旧制中学卒業者および 古文の文法知識が多い者しか正しく運用できぬからである。 うーむ。「頻繁にデータを更新すべき」ってたぶん見出しで、「頻繁にデータを更新すべきである」を略したものとして「すべき」を使っているので、「すべし」だと自分としてはニュアンスが変わってしまう気がするけれども、どうなんだろう。「すべし」は「すべき」よりも命

    正しい日本語なんて無いんじゃない - mizuno_takaakiの日記
    denken
    denken 2006/06/21
    「すべき」と「すべし」の違いの話。ていうかあれでしょ、「ある」は最初「あり」だったけど、皆が係り結びを連発するものだから「ある」が普通になったって話を古典の授業で聞いた気がするけどそんなもんでしょ。
  • 赤尾晃一の知的排泄物処理場(わかば日記) 最高裁死刑判決の元少年の実名/匿名の分かれ道

    同僚も気になっているという、Saiさんの「即惚れ4ツボ口説き術」。 警戒心バリバリのお堅いお嬢様でも、彼氏持ちの女友達でも、いつも素っ気ない会社のあの子でも、その日のうちにラブラブベッドインさせてしまった口説き術って言ってますね。 そんな簡単に効果って出るんですかね。 興味はありますが、まだよくわからない。 ⇒ 詳しい方法と体験談を見てみる お目当てのあの子や出会い系で見かける激カワ女子のココロもカラダも支配して強制的に欲情させ、我を忘れて卑猥にヨガるオンナにメス堕ちさせることができるみたいですね。 それなら悪くない? 使ってみてもいいかも。 即惚れ4ツボ口説き術 Sai レビュー 特典 こんにちは。 あなたは、可愛くてドストライクな好みの女子たちと、楽しいSEXライフを送っていますか?もし、全然エッチに持ち込めてないなら、5分だけ私の話を聞いてください。 私が伝えたいのは、女性を誘って1

    赤尾晃一の知的排泄物処理場(わかば日記) 最高裁死刑判決の元少年の実名/匿名の分かれ道
    denken
    denken 2005/07/18
    元活動家の奥さん萌え。
  • 1