閲覧には管理人が設定したパスワードが必要です。※cookieを有効にしてください。 一度cookieに登録すると次回ログインフォームが省略されます。
最近、「オープンソース」という言葉の意味を巡る論争が再燃したようだ。混乱が生じるのは、「オープンソース」という概念自体に、性格の異なる二つの要素が詰め込まれているからではないだろうか。 法的状態としてのオープンソース ソフトウェア開発の文脈における「オープンソース」という言葉は、あるガイドライン(「オープンソースの定義」)を満たしたライセンスの下で公開されているソフトウェア、という意味である。先行した「フリーソフトウェア」という概念の言い換えとして生まれたものだ。これを、「法的状態としてのオープンソース」と呼ぶことにしよう。 「オープンソースの定義」が試みているのは、ソフトウェアの第三者による利用、特に改変や配布に関して著作権者が課す条件に対し、一定の基準を設けるということである。これにより、法的状態としてのオープンソースが保証されているソフトウェアであれば、個別にはどのようなライセンスが
Ph.D. Thesis Richard C. Wang: Language-Independent Class Instance Extraction Using the Web. In CMU SCS Technical Report Series (CMU-LTI-09-020), 2009. PowerPoint Slides: phd-thesis.ppt Thesis Systems Automatic Set Instance Acquirer (ASIA) Instance Acquisition refers to extracting instances of a given semantic class name (e.g., car makers => Ford, Nissan, Toyota). ASIA extracts set instances by uti
もっと評価されるべき日本語の実力シリーズの第2回。今回は現代中国語が日本起源の和製漢語なしには成り立たないというお話。やや硬い内容なので興味のある方はどうぞ。 漢字の特徴の一つとして高い造語能力があげられる。ところが歴史を見てみると漢字の造語能力を存分に活用した事例は意外に少ない。伝統的中国語(漢文)においては漢字一文字で一つの概念や事柄を表すのが普通で、二文字以上の熟語は実はそれほど多くない。そのため中国では思想活動の活発だった春秋戦国時代(紀元前770-前221年)と仏教用語を翻訳するときに二文字以上の新語を多く造りだした程度である。漢字の高い造語能力は近代に至るまでかなり低レベルでしか活用されてこなかった。 ベトナムや韓国はもっぱら中国式の漢文を忠実に受け入れてその枠の外に出ることはほとんどなかった。韓国独自の造語もあることはあるのだがその数は少ない。 日本はまったくの例外である。漢
ひらがなばかりで書かれた文章なのだが、文字の順序がでたらめになっていても読めてしまうという現象が話題を呼んでいる。 ねとらぼ:確かに"読めてしまう"コピペに2ch住人が「人間すげー」と驚く - ITmedia News 「確かに読めてしまう」コピペが流行中―英文元ネタや派生ジェネレータも - はてなブックマークニュース このブログでは2003年9月にこの話題を扱っていた。 語中がデタラメでも英文は読める [絵文録ことのは.]2003/09/20 語中がデタラメでも英文は読める-2-GUITCHUSからの手紙 [絵文録ことのは.]2003/09/23 「英国ケンブリッジ大学の研究結果」というのは都市伝説である。また、「語の中の文字の順序を変えても読める」というのは言語学において実証された科学的発言ではないことに注意(それっぽい実例は作れるが、それが成立する条件やメカニズムについては論証されて
「なんだこりゃ」と思ってよく“読んで”みると「へー」と驚くコピペ文章が最近2ちゃんねるに登場し、スレッド(スレ)の本題そっちのけでコピペに関する考察レスが交わされる……なんてことも起きている。 コピペ文はひらがなとカタカナだけで書かれており、一見すると2chでたまに見かけるうわごとにしか見えない。だがよくよく“読んで”みると、「確かに読める」と、ちょっと驚く。どうして「読める」のかは、コピペ文自体が説明してくれている。 「【ネット】「ウィキペディアが与える影響を調べるため」学生がもっともらしい嘘の書き込み 多数の欧米大手紙がだまされて引用」では、このコピペが2レス目に登場。「読めた」「人間の脳すげー」といったレスが相次ぎ、本題へのレスと入り交じって何のスレなのか分からない状態になっていた。 コピペが登場したスレには、人の記憶と認識に仕組みについて考察や、読める人と読めない人の違い、現象学的
こんにちは。エイプリルフールに 1 日だけローンチした Google 川柳、お楽しみいただけましたか?エイプリルフールが終わってしまったのでサービスはもうありませんが、せっかくなのでその裏側をすこしご紹介します。 今回は、Google が人工知能 CADIE を開発し、その CADIE が世界中で面白いサービスを提供するという設定で Google 川柳を提供しました。人工知能 CADIE は架空のものですが、コンピューターによる川柳の自動生成を行ったのは、ウソではありません。 ここでは、その川柳をコンピューターに生成させた手順を簡単にご紹介します。 川柳とは何かを学習する まず、本物の川柳/俳句を Web 上から集めました。集めた作品を解析し、俳句/川柳にありがちな品詞の並びパターンを学習しました。「瞬間」を切り取る 川柳/俳句には、「話題」が必要になります。これは、Web ページからラン
世の中の文系(非理系)の人が理系チックな表現をしようとして、 理系の人間が聞くと「その用法はありえねぇ!」と思うものが 少なからずあります。 俺が理系を代表してるかはわからないけど、 あくまで主観で、違和感を感じた例をいくつか挙げてみます。 ■理論的 先人の偉大な理論があれば別だが、 そういうのでない限りは「論理的」であっても理論じゃありません。 ■「ベクトル」の誤用 ベクトル自体は理系も使うんだけど、 ベクトルは、方向という意味ではありません。 なので「ベクトルは同じ方向に向かってる」とは言うが、 「ベクトルは同じなんだけど大きさが違う」みたいなことは言いません。 ■加速度的に 僕は絶対に使いません。加速度は値です。値というか、ベクトル。 「加速的」の方がいいと思います。 ■力学が働く なにかしらの外部要因的影響が発生する、の意らしい。 力学は学問なので、働きません。「力」のことでしょう
日本語 WordNet リリース * 画像 * ダウンロード * 今後の予定 * 参考文献 * リンク * English 本プロジェクトでは、 Princeton WordNet や Global WordNet Gridに 着想をえて、日本語のワードネットを構築し、オープンで公開します。 独立行政法人情報通信研究機構(NICT)では、自然言語処理研究をサポー ト する一環として、2006年に日本語ワードネットの開発を開始しました。最初の 版、version 0.9は、2009年2月にリリースされました。このversion 0.9は、 Princeton WordNetのsynsetに対応して日本語をつけています。もちろん、 Princeton WordNetにはない日本語synsetを付与する必要があり、また、 Princeton WordNetにみられるsynsetの階層構造に、
sourceforgeに移りました。こちらからどうぞ。 ダウンロード(SkyDrive) V1.1.0との変更点は 表記ゆれと見なす基準を、「表記が同一」から「発音が同一」に変更しました。 (これによって、「ヴァイオリン」と「バイオリン」の表記ゆれが判別できるようになりました。) 上記変更に伴い、発音を辞書に含める。 地名と組織の固有名詞を辞書に含める。 その他バグを修正 以上です。見出し語が4,000、表記ゆれ候補数が約17,000増えました。 MD5(V1.1.0) 7bd5ba4c73da418eaa740e64bbd7e198 SHA-1(V1.1.0) a890161c8e2cb9b62f375875b49f6f7037030781 SHA-512(V1.1.0) 03a3add26998f0df100db3d688aae79405c2d81f9249da253f5ee93855
2ちゃん語と言われる物が大量にある。 しかし、よく考えると書き言葉というのは話し言葉と違って保守性が 強いと言われる。さて、なぜ2ちゃん上では数多くの流行語が現れては 消えるのか、言語学板はどう考える?
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く