日本語で書かれたウェブ上のテキストを巨大な例文集(コーパス)とみなし、それを検索します。JReK(ジェイレック)は、 日本語のウェブページのテキストを 巨大な例文集(コーパス, Corpus)とみなし、 それを検索するサイトです。 日本語作文の際に役に立つかと思います。 JReK is a Japanese web corpus search site. It is usefull for learners of Japanese!
Accurately conveying Japan, present and future, to the world. Mission Providing trustworthy information that deepens understanding of, and generates interest in, Japan. 世界中で、日本に興味を持つ人を増やし、日本についての理解を深めるために、私たちは、信頼できる情報を提供します。 Vision Contributing to a better world through the promotion of mutual understanding between Japan and various international communities. 日本と世界の相互理解を推進することで、よりよい世界の実現に貢献します。
ある記事を 紹介します。 「日本語から漢字を引算できるか?」(彎曲していく日常) うえの記事は、日本語から 漢字を とりのぞこうとするのは、排他的なナショナリズムだという内容です。 こうした主張は、子安宣邦(こやす・のぶくに)『漢字論-不可避の他者』岩波書店に かいてあるはなしです。 わたしは日本語表記の問題について 8年まえから かんがえています。わたしの議論は つぎのとおりです。 漢字は、文字表記として ふくざつすぎるために、さまざまな文字弱者を 排除し、抑圧している。 もちろん、漢字を なくせば 文字弱者が いなくなるわけでは もちろんない。だが、おおきく改善することが たくさんある。 わたしが「漢字という障害」という論文で指摘した漢字弱者は、非識字者や識字学習者、盲人、弱視者、ろう者、中途失聴者、読字障害を もつひと、知的障害者、日本語学習者です。 そうしたひとたちが文字情報にアク
私が学生の頃に聞いた話なので、今となっては半世紀も前のことなのかもしれませんが、日本の魚類学が世界をリードしていた時代があったのだそうです。その頃は魚類学に限らず、日本人が書く科学論文の多くは日本語で書かれ、日本国内の雑誌に載っていたのだと思います。ところが、世界中の魚類学者、特にアメリカの魚類学者は日本の魚類学の成果を読みたくて仕方がなかったようで、なんと日本の学術雑誌(「魚類学雑誌」?)がアメリカで翻訳されて流通していたという話を聞きました。 しかし、その他の業界の論文は日本語で書いても世界の誰も読んではくれなかったようです。つまり日本の科学のレベルが低かった、あるいはほとんど評価されていなかったので、わざわざ翻訳してまでも読んでくれる人がいなかったということなのだと思いますが、すでに何年も前に日本語で論文が書かれていたのとほとんど同じ内容の研究成果が外国人の手によって英語で出版され、
2007日本語プログラミングコンテスト * ようこそ! 日本語プログラミングコンテストのWebサイトへ! 日本語プログラミング言語の普及と活性化のために、 合同主催のプログラミングコンテストを開催します。 2007年の最後、盛大に日本語プログラミング言語を盛り上げましょう! ↑ 表彰式について * 開催日時 4月18日(金) 表彰式 15:00-17:30 懇親会 18:00〜 場所 表彰式 明治大学 駿河台キャンパス リバティタワー15階の1156教室 アクセス 懇親会 台北風情 参加の手続き 参加を希望される場合は、事前にメールで下記にお知らせください。 jp-procon2007-info あっと yahoogroups どっと jp 上記アドレスの[あっと]と[どっと]を記号に置き換えたもの メールには、氏名およびハンドルネーム、年齢、職業などをお書きください。 会場の都合
突然ですが、穴埋めクイズです。下線部に入る単語はなんでしょう? グーグルで_____ おそらく、「検索」「調べる」「探す」といった単語を思いつくのではないでしょうか? 実際に、Webにあるドキュメントをくまなく調べ、「グーグルで」の後にくる単語を調べると、「検索」が1位であるとがわかります。 一般に、直前の(N-1)個の単語を見て、次の単語を予測するモデルをN-gram言語モデルといいます。さきほどは、「グーグル」 と 「で」の2単語から次を予想しているので、3-gram言語モデルの例となります。現時点の単語が、直前の(N-1)個のみに影響を受けるという仮説は、一見現実離れしているようですが、実際には非常に有効な場合も多く、かな漢字変換、OCRのエラー訂正、機械翻訳、音声認識などに広く用いられています。たとえば、音声認識の場合、ノイズ等で現時点の単語をシステムが聞き取れなくても、言語モデル
JavaScript で形態素解析もどき JavaScript で形態素解析のようなものを。 totonの日記 - すべての漢字を取り出す正規表現 「すべての漢字を取り出す正規表現」をPHPで試す:phpspot開発日誌 これらの記事を参考にして JavaScript で漢字、ひらがな、カタカナ、英数字に区切ることをしています。 ただ、文字コード的にちゃんとできるのか、よくわかりません。Seesaa はShift_jis なのでおかしくなる場合もあるかも知れないです。 下のテキストエリアに文章を入力して解析ボタンを押すと解析結果が表示されます。解析というか、単純に改行で区切っているだけですが。 サンプルは青空文庫の太宰治 走れメロスの冒頭部分。 メロスは激怒した。必ず、かの邪智暴虐(じゃちぼうぎゃく)の王を除かなければならぬと決意した。メロスには政治がわからぬ。メロスは、村の牧人である。笛
このページでは、正確な文章を書くための秘訣をまとめてみようと思います。それほど文章がうまいとはいえない私が、文章の書き方について述べるのですから、むこうみずな行為であることは百も承知です。しかし、数年に渡って探求した正確な文章の書き方が、少しでもみなさんの役に立てばという思いを自分への励ましに代えて筆をとります。 ここでお話するのは、「文章をいかに正確に書くか」や「自分の考えをどうやったら適切に表現できるか」であって、決して「どうやったら人を感動させる名文句が書けるのか」ではありません。 このページを読んだら「科学技術文献」を書くための技術が少しは身に付くのではないかと期待しています。しかし、 人はいさ 心も知らず ふるさとは 花ぞ昔の 香ににほひける (紀貫之) などのような心に残る文章が頭に浮かぶようになるわけではありません。 絵の書き方に例えて言うなら、ここで述べる内容は、色彩や調和
「今日の悪文と不正確発音」というまぐまぐから発行されているメールマガジンがありまして、拙作「Web検索エンジンGoogleの謎(asin:488166395X)」が取り上げられていましたよ。 水野貴明(2004)著、「Web検索エンジンGoogleの謎」 で「頻繁にデータを更新すべき」⇒「すべし」 「べし」の終止形を「べき」とする誤りは非常に一般化しており、 正しく「べし」と使っている例は珍しい。 そのわけは、この言葉「べし」は文語なので、 敗戦前の旧仮名遣い時代の旧制中学卒業者および 古文の文法知識が多い者しか正しく運用できぬからである。 うーむ。「頻繁にデータを更新すべき」ってたぶん見出しで、「頻繁にデータを更新すべきである」を略したものとして「すべき」を使っているので、「すべし」だと自分としてはニュアンスが変わってしまう気がするけれども、どうなんだろう。「すべし」は「すべき」よりも命
同僚も気になっているという、Saiさんの「即惚れ4ツボ口説き術」。 警戒心バリバリのお堅いお嬢様でも、彼氏持ちの女友達でも、いつも素っ気ない会社のあの子でも、その日のうちにラブラブベッドインさせてしまった口説き術って言ってますね。 そんな簡単に効果って出るんですかね。 興味はありますが、まだよくわからない。 ⇒ 詳しい方法と体験談を見てみる お目当てのあの子や出会い系で見かける激カワ女子のココロもカラダも支配して強制的に欲情させ、我を忘れて卑猥にヨガるオンナにメス堕ちさせることができるみたいですね。 それなら悪くない? 使ってみてもいいかも。 即惚れ4ツボ口説き術 Sai レビュー 特典 こんにちは。 あなたは、可愛くてドストライクな好みの女子たちと、楽しいSEXライフを送っていますか?もし、全然エッチに持ち込めてないなら、5分だけ私の話を聞いてください。 私が伝えたいのは、女性を誘って1
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く