知っているようで実はあまり知らない、⽇本語以外の多⾔語組版について、基礎ルールが学べる記事をまとめています。 掲載中の⾔語のほか、他の⾔語の組版についてもご紹介予定です。
知っているようで実はあまり知らない、⽇本語以外の多⾔語組版について、基礎ルールが学べる記事をまとめています。 掲載中の⾔語のほか、他の⾔語の組版についてもご紹介予定です。
導入 アイヌ語は日本語と異なり、閉音節(子音で終わる音節)も存在するので、表記の際音素文字であるラテン文字なら、そのまま p, t, k, m, n, s, r などの子音文字を後ろの付ければ良いわけなので、アイヌ語ローマ字表記では、何も問題が生じない。しかし、元々開音節言語である日本語に特化したカタカナのような仮名文字で表記する際、鼻音 n は「ン」でなんとかなる(実はそれでもまずい事になっているけどここでは割愛する)が、p, t, k, m, n, s, r, h はどうしようもないので、特殊の捨て仮名(小書き仮名文字)を利用することになっている。 具体的には以下のような特殊仮名文字(通称 アイヌ語仮名)である。 ㇷ゚ -p ッ -t ㇰ -k ㇺ -m ㇱ -s ㇻ -(a)r, ㇼ -(i)r, ㇽ -(u)r, ㇾ -(e)r, ㇿ -(o)r お分かり頂けただろうか… 問題 r
usagimaru ⌘ @usagimaruma 日本人が想像するよりかなり広い範囲で日本語文字が中華フォント化している現象。CJK処理系における日本語の扱いに対する問題としてそろそろ何とかしていかないと、ソフトウェアの中の日本語が死んでいく危機感がある。そもそもなんでChineseに分類されるフォントにフォールバックされるのかって。 2022-09-28 16:03:32 usagimaru ⌘ @usagimaruma 前も調べたけど、言語環境の言語優先度設定で“わざわざ”日本語を優先言語にしておかないと、日本語の文字の多くは簡体中国語の奇妙なフォントで描画される。バグではなく仕様。わざわざ日本語を優先している民族なんて日本人しかいないから、世界のほとんどはきっと中華フォントで日本語を眺めている。 2022-09-28 16:07:52
字幕翻訳スクールがAI字幕翻訳ツールを開発したというニュース 数日前に字幕翻訳スクールがAI字幕翻訳ツールを開発したというニュースが流れ、翻訳者たちの間に衝撃が広がりました。これを受けて翻訳者の堂本秋次さんがYouTubeで緊急動画を配信され、それを見たローズ三浦さんの発案で堂本さん、ローズさん、私の3人で機械翻訳の現状についてライブ配信することになりました。当日の告知にもかかわらず30名以上に方々にライブでご視聴いただき、その場でコメントもたくさんいただき成功裡にイベントは終了しました。(3人のトークイベントの動画はこちら:https://www.youtube.com/watch?v=L09NEJLBNzU) 普段「機械翻訳についてどう思いますか」と聞かれるわりに回答にこれほど長い時間をいただけることはなかったので、司会の堂本さんが用意してくださったテーマでお2人と話すことで私自身とし
ゲームボーイ はじめに この連載では,広い学びへ興味をもつきっかけになればといいという目的で,第一学習社の編集者が見かけた興味深い論文や研究を不定期に紹介していきます。 論文というのは,学びの最先端がまとめられたとても面白いものです。しかし,大学の研究以外では,日常的に触れることは多くありません。また,内容も難解なものが多いです。しかしそのハードルを越えれば,自分の目で見る世界の解像度が,少し明瞭になっているはずです。 はじめに Pickup 用語解説 音象徴,有声阻害音 ブーバ・キキ効果 最大エントロピーモデル 読んでみよう。 まとめ 参考リンク Pickup 今回,紹介するのは音声学の分野からこちらの論文です。身近なテーマ,ポケモンに関する論文です。 www.jstage.jst.go.jp 音声学はその名の通り,「音と声にまつわる全て」を研究する学問となります。そのため言語や音楽と関
センターの英語かなんかで出てきたんですかね、「摩天楼」を意味する「Skyscraper」についてのツイートが伸びていました。 skyscraper すなわち「空をこするもの」を「摩天楼」と訳した人は本当にセンスある。skyを空ではなく天にしたり、scrapeに擦でも掻でも磨でもなく摩を当てる雅びな言葉選びで、「まてんろう」という音の響きもいい。そして読み下せば「天を摩する楼」ってまんま原語の直訳。天才の所業だわ。 — 佐藤ケイ(´ヮ` )11月新刊 (@K9uNS7uFrBC31BA) 2018年1月15日 skyscraperを「摩天楼」という字をあてたことに対するすばらしい感覚について述べていますが、果たして本当のところ、この語を誰が訳したのか、調べてみました。ちなみにこのツイートのリプについている情報は興味深いものばかりなので、目を通されることをオススメします。 skyscraper
1 卒業研究 ( 文体練習 ) 日本近代文学 柴田勝二ゼミ 外国語学部 南・西アジア課程 トルコ語専攻 8507260 大村真央 2 ( 文体練習 )目次 0 素 1 ひらがな 2 カタカナ 3 ローマ字 4 ギャル文字 5 2ちゃんねる 6 Twitter 7 100 字 8 なんか 9 え~ 10 英訳 11 重複 12 アメリカ人きどり 13 短歌 14 某 15 とても 16 星新一調 17 オノマトペ 18 誤変換 19 ~じゃないですか 20 レストランにて 21 はんたい 22 漢文風 23 和製英語 24 数値 25 漫才 26 あいうえお作文 27 田舎の母への手紙 28 なぜかよめてしまう 29 小学生の日記 30 類義語 31 別の視点からⅠ 32 別の視点からⅡ 33 別の視点からⅢ 34 別の視点からⅣ 35 客観 36 古文風 37 お嬢様 38 事情聴取 39
Introduction TUFS言語モジュールは,東京外国語大学大学院の21世紀COEプログラム「言語運用を基盤とする言語情報学拠点」の研究成果を活かして開発した,新しいインターネット上の言語教材です。英語以外の言語教材は,主として大学生が初めて新しい外国語を学ぶための教材を想定しています。英語については,小学校での総合学習や中学校で初めて学ぶ外国語としての英語を念頭において開発しました。 2004年6月に「発音モジュール」が12言語で公開され,それに先立つ2003年12月には「会話モジュール」が17の全ての言語で公開されました。 続く2006年4月には,「文法モジュール」が10言語で公開され,「語彙モジュール」も2言語で公開中です。 これらの教材は,東京外国語大学の教員,大学院生および学外協力者を含む100名以上の協力によって開発されました。 詳しくは開発者一覧をご覧ください。 さらに
このコラムは,『春秋』(2017年7月号,8/9月合併号)に連載した内容に,リンクをつけたり加筆修正したりして,さらにイントロを書き足したものです。 言語が減ることって問題ですか?私は言語学者である。琉球列島の言葉を専門にしている。 下地理則の研究室 冒頭の問いは,これまで何十回も,話者の人たちから,学生たちから,講演会での聴衆から,そして同業者たちから,投げかけられた問いである。同じような問いをされた言語学者も多いと思うし,自問している人もいるだろう。だから,この問題に対する私なりの回答を書き留めておくのは意味があることだと考えて,コラムにすることにした。 かなり前からのことではあるが,とりわけ21世紀に入って,言語学の世界では言語の消滅危機が大きな問題になっている。以下で述べるように,世界には7000近くの言語があるが,これが今世紀中に,50〜90%消滅する可能性がある。 さて,ここで
調査した結果、もともと「てふ」は「ちょう」とは読まなかったことが判明した。 調査した資料に書かれていたことをまとめると次の通り。 ・昆虫の蝶は、昔は和語の「カハヒラコ」と呼称されていたが、平安時代、外来語の呼称「tiep」に取って代わられた。 この発音「tiep」をそのまま文字に書き写したものが「てふ」だった。 ・この発音「tiep」は、時代を下るにつれて変化していく。 具体的には、平安中期以降から鎌倉時代にかけて「てう」に変化し、 江戸時代までには「ちょお」と発音するようになった。 ・ところが「てふ」という表記だけは変わらずに「てふ」のまま残り続けた。 このずれのために、「てふ」と書いて「ちょう」と読むようになった。 〇調査した資料 ・『国語科図説:図説全集』(石井 庄司/編著 岩崎書店 1960) p.238-239「歴史的かなづかいは、われわれ現代人の発音を写し書くには、まことに不便
プログラミング初心者に対してどういう情報が役立つのかをぼんやり考えていると、そこそこコードを書けるベテランが、いつ、どういうことにつまづいてきたのかを書くとけっこう有益なのではないかと思ったので書きました。これを読むと直接プログラミング能力が上がるわけではないですが、「ああ、こういうところでつまづいてもいっぱしのプログラマになれている人もいるのだな」と思ってもらうのが目的です。成功談よりも失敗談のほうが役立つとよく言われますが、それと少し似ているのかもしれません。 全段落で「いっぱしのプログラマ」とか言った手前、自分のことを書いておきます。18歳ごろから20年くらい前からプログラミングをしていて、主に有名どころのOSSに向けてコードを書いてきました。昔はLinuxカーネルを10年少々やっていて、ここ最近はCephオーケストレータであるRookの開発とかをしています。プログラマとしてはスーパ
すきえんてぃあ@書け @cicada3301_kig カキクケコ [k'ə ks kɸ k'ɛ k'ɔ] サシスセソ [ssə ss sɸ ssɛ ssɔ] タチツテト [tə tss tsɸ tɛ tɔ] ハヒフヘホ [xə xs xɸ xɛ xɔ] 2019-12-01 19:18:15 すきえんてぃあ@書け @cicada3301_kig 中学生が「そこでクスクス笑ったら負け」とか言ってるシーンがあったんだけど 「クスクス」が子音の無声化とかじゃなくてナチュラルに ksskss みたいに発音していて、普段会話に使っている音素を笑い方のオノマトペに当てた感じだった twitter.com/cicada3301_kig… 2019-12-01 19:23:07 すきえんてぃあ@書け @cicada3301_kig 「今日」がほとんど「キャー」に近く聞こえる人がいた 半狭母音が下がってがっ
「もっと人間にとって扱いやすい、自分の言語をつくってみたかった」。10月20日に東京の秋葉原コンベンションホールで開催された第40回「U-22プログラミング・コンテスト2019」の最終審査会で、見事、経済産業大臣賞(総合)を受賞した開成中学校3年の上原直人さん(15歳)は、独自プログラミング言語「Blawn」を発表した。IT業界の経営者など、並みいる審査員を驚かせたのは、完成度の高さはもちろんのこと、今年8月からわずか数週間で完成させたスピードだった。一次審査の応募期間7月1日~9月2日に着想から開発、完成まで一人で仕上げたという。 C言語を使ったのは今年7月 それまでPythonを使っていたという上原さんは発表の中で、「今年の7月か8月にC++を始めたが、扱いにくかった。もっと可読性の高い構文とメモリの安全性や速度を高めたいと思った」と、開発のきっかけについて語った。 質疑応答で審査員か
実行環境 macOS High Sierra 10.13.6 Python 3.5.1 方針 実装方法 偽中国語の慣例上 1 、 - 動詞「○○する」は「○○実行」と変換することが多い - 「明日お酒飲みに行かない?」のような提案する文章の場合、文末に「如何?」を付ける - 「私は◯◯したい」のようは希望を表す文は、文末に「希望」を付ける - 「お酒を飲む」は「飲酒」のように、熟語を形成する場合が多い というルールがあるようです。 そのため、上記の偽中国語変換を実現するために、 品詞情報まで活用した変換処理 を実施しました。 構文解析を行う 品詞情報を活用するには形態素解析を行う必要があります。この構文解析処理は COTOHA API の構文解析APIを活用しました。 ※参考 (自然言語処理を簡単に扱えると噂のCOTOHA APIをPythonで使ってみた) 日本語の文字列を構文解析し、
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く