タグ

言語に関するshidhoのブックマーク (89)

  • 否定文を理解できないAIたち - ジョイジョイジョイ

    BERT や GPT の登場により、テキストを扱うモデルは大きく発展しましたが、否定というごくありふれた操作を扱うのが依然難しいです。 稿では、その理由と、部分的な解決策を紹介します。 目次 目次 否定文を理解できないAIたち 否定文を理解できずに困ること なぜ否定文をうまく扱えないのか なぜたまに成功するのか 対処法 ファインチューニング プロンプトの工夫 否定文を意識した訓練 文書数を増やす クエリとキーを拡張する おわりに 否定文を理解できないAIたち BERT (tohoku-nlp/bert-base-japanese-v3) で A =「私はお寿司が好きです。」 B =「私の好きなべ物はお寿司です。」 のテキスト埋め込みのコサイン類似度を求めてみましょう。A と B は同じようなことを言っており、予想されるようにコサイン類似度は 0.9695 と高いです。 では、 A =「

    否定文を理解できないAIたち - ジョイジョイジョイ
    shidho
    shidho 2024/12/19
    日本の首都は法的には存在しないし、インドネシアは遷都の作業中だし、読む時期によって微妙な例で試してるなあ。/まあDeepLも二重否定の文章はけっこう翻訳に失敗するっけ。
  • プログラマが知るべき97のこと

    プログラマが知るべき97のこと大人気の書籍『プログラマが知るべき97のこと』のエッセイを無料で公開中!すべてのプログラマにおすすめのがウェブで読めるようになりました。 エッセイ一覧分別のある行動関数型プログラミングを学ぶことの重要性ユーザが何をするかを観察する(あなたはユーザではない)コーディング規約を自動化する美はシンプルさに宿るリファクタリングの際に注意すべきこと共有は慎重にボーイスカウト・ルール他人よりまず自分を疑うツールの選択は慎重にドメインの言葉を使ったコードコードは設計であるコードレイアウトの重要性コードレビューコードの論理的検証コメントについてのコメントコードに書けないことのみをコメントにする学び続ける姿勢誰にとっての「利便性」かすばやくデプロイ、こまめにデプロイ技術的例外とビジネス例外を明確に区別する1万時間の訓練ドメイン特化言語変更を恐れない見られて恥ず

    プログラマが知るべき97のこと
    shidho
    shidho 2024/12/12
    81.のところに1つ誤字らしきものを見つけたのだが、これは元からあってCCの制限で治っていないのか、誰も指摘していないのかどちらだろう。よりによって「エラーがエラーを」の項目で著者の故意の可能性すらあるし。
  • Microsoft Word - 最終版台?日本語語彙

  • ごちゃまぜという意味の「ちゃんぽん」と料理の「チャンポン」は関係があるのか?

    以下、ごちゃまぜという意味の言葉は「ちゃんぽん」、料理のほうは「チャンポン」と表記する。 まず辞書では、 ちゃん‐ぽん[名・形動]《「攙和」の中国音からか》 1 2種類以上のものをまぜこぜにすること。また、そのさま。「日酒とウイスキーをちゃんぽんに飲む」「話がちゃんぽんになる」 2 肉・野菜などをいため、小麦粉に唐灰汁を加えて作った中華風の麺と一緒にスープで煮た長崎の名物料理。 ちゃんぽん(チャンポン)とは? 意味や使い方 - コトバンク たいていは先に書かれるほうが古い用法なので、ごちゃまぜの「ちゃんぽん」のほうが先にあったということだろう。 しかしWikipediaで「ちゃんぽん」を調べると、いくつかの語源説が出てくる。 中国語でさまざまな物を混ぜることを意味する「攙 (chān)」と(中略)料理法を意味する「烹 (pēng) 」を合わせた「攙烹」とするもの「攙」を語源とする中でも「

    ごちゃまぜという意味の「ちゃんぽん」と料理の「チャンポン」は関係があるのか?
    shidho
    shidho 2024/12/03
    料理の「チャンポン」はどこの料理だろうか。長崎だろうか、沖縄だろうか(沖縄のちゃんぽんは麺料理じゃない)、と言って更に火種を投げ込む。
  • 「ネギ」「ナス」はタイ語で?身近な野菜のタイ語12選 | THE RYUGAKU [ザ・留学]

    シェアツイートB!はてぶポケットネギやナス、トマトなど日でも身近な野菜。タイでも日と同様に英語がそのままタイ語訛りになったものや、元々タイ語としてある言葉など様々な名前があります。ここでは身近な野菜の中から、一つの単語から多くの種類が覚えられる野菜のタイ語名称についてご紹介します。 スポンサーリンク

    「ネギ」「ナス」はタイ語で?身近な野菜のタイ語12選 | THE RYUGAKU [ザ・留学]
    shidho
    shidho 2024/11/20
    分類する言葉の意味まで書いている解説は初めて見たかも。書く位置が微妙だけど。
  • 『葬送のフリーレン』のドイツ語

    平塚 徹(京都産業大学 外国語学部) 京都産業大学外国語学部では、英語ドイツ語・フランス語・スペイン語・イタリア語・ロシア語・中国語・韓国語・インドネシア語を専門的に学ぶことができます。 『葬送のフリーレン』に出てくる人名や地名のほとんどはドイツ語が使われている。ドイツ語は「かっこいい」というイメージがあって多くのアニメで用いられている。しかし、プリキュアの名前は英語やフランス語などが使われているのに対して、ドイツ語は使われておらず、「重厚」なイメージが合わないと考えられていると想像される。それに対して、『葬送のフリーレン』のファンタジーの世界観にはドイツ語は相応しいと考えられたのであろう。ところが、主人公のフリーレンと準主人公のフェルンの名前の音は、プリキュア名によくあるパターンに合致している。プリキュア名の「キュア」に続く語は、両唇音で始まるものが多く、ラ行音が多いが(「プリキュア

    shidho
    shidho 2024/11/05
    あのマンガのドイツ語訳はこの辺の固有名詞どうするんだろうね。そのままでいくのかしら、それともlrの入れ替えとかszの入れ替えとかするのかな?
  • 一般財団法人鹿島平和研究所

    shidho
    shidho 2024/09/11
    結局文章読解に一番重きを置く、というのは英語教育と同じやり方のような気がする。
  • ファンタジー・SF映画向けに「架空言語」創作 米国人夫婦

    北アイルランド・バンブリッジで行われた「ゲーム・オブ・スローンズ」のスタジオツアー(2022年2月2日撮影)。(c)Paul Faith / AFP 【8月12日 AFP】テレビシリーズ「ゲーム・オブ・スローンズ(Game of Thrones)」のドスラク語やヴァリリア語、映画『デューン(Dune)』のチャコブサ(Chakobsa)砂漠の民が話す言葉。こうした架空の言語は、米国人のデービッド・ピーターソン(David Peterson)氏とジェシー・ピーターソン(Jessie Peterson)氏夫が考案したものだ。映画テレビドラマのキャラクターのために語彙(ごい)や文法をつくり出すことを職業にしているのは、世界中でこの2人しかいないとみられている。 「あなたは私の最後の希望、わが血族の血」 「ゲーム・オブ・スローンズ」でドスラク語のせりふが語られると、視聴者はファンタジーの世界に一

    ファンタジー・SF映画向けに「架空言語」創作 米国人夫婦
    shidho
    shidho 2024/08/13
    神話を作るなら、その神話を語るための言語からまず作るのは当たり前の話だろうよ(トールキン並みの感想)
  • 【哲学】すげー鬱拗らせてブラジル戻った時、親父に「おまえその悩みをポルトガル語で言語化できるか? できないよな。なら今日からブラジルにいる間はポルトガル語で思考しろ」って言われて、驚くくらい悩めなくなったのよね

    榎宮祐♟️ノゲノラ @yuukamiya68 「ノーゲーム・ノーライフ(著・絵・コミカライズ)」、「クロックワーク・プラネット(共著)」とか小説イラスト漫画を無軌道に書いてる在日ブラジル人。 →FANBOX:yuukamiya68.fanbox.cc →fantiafantia.jp/yuukamiya68 →嫁:@u2603 youtube.com/channel/UCRBr4… 榎宮祐♟️ノゲノラ @yuukamiya68 これ、当に興味深い経験で。すげー拗らせてブラジル戻った時、親父に「おまえその悩みをポルトガル語で言語化できるか? できないよな。なら今日からブラジルにいる間はポルトガル語で思考しろ」って言われて、驚くくらい悩めなくなったのよね…… x.com/yuukamiya68/st… 2024-06-29 17:10:35

    【哲学】すげー鬱拗らせてブラジル戻った時、親父に「おまえその悩みをポルトガル語で言語化できるか? できないよな。なら今日からブラジルにいる間はポルトガル語で思考しろ」って言われて、驚くくらい悩めなくなったのよね
    shidho
    shidho 2024/07/09
    日本だと「会いたくて会いたくて震える」と西野カナが一曲つくるくらいに冗長な表現が、タイ語だと「คิดถึง」という2音節語になる。しかもこれ男女間どころか友人家族その他でも使うんだ。
  • 日本に来たら日本語を喋れ英語を使うなって人は、海外では常に現地語を話すの?

    中国に行ったら中国語 インドだったらヒンディー語 UAEならアラビア語 世界一周旅行をしようとしたら10ヵ国語ぐらい喋れる必要があるのかな? 凄いねー。 俺なら無理だな。 そういうのを何とかするために英語ってのがあるんだけどなあ。 英語を覚えたら全世界でなんとかなる。 翻訳アプリもだいたいは英語をベースに作っているから。 「日語を脳内で英語にする→英語を翻訳アプリで現地語にする」って流れでどの国の言葉でもなんとかなる。 なんだろうな、翻訳アプリの使い方における基礎的なスタイルが確立してないのが良くないと思うんだよね。 無理に口に出すから混乱するっていうか、翻訳アプリの翻訳画面を見せての筆談形式にするのがいいのかな。 まあゆーてちゃんと通じるのかは不安だけど。 つーか英語出来ないやつ多すぎだろ日。 卑弥呼や信長の話なんて覚えるよりも先にまずは英語を勉強したほうがいいよ。

    日本に来たら日本語を喋れ英語を使うなって人は、海外では常に現地語を話すの?
    shidho
    shidho 2024/04/26
    ホテル以外は全部現地語勉強して行くなあ。
  • タイ語<例文14件>レストランシリーズ全6回の1回目。予約。予約時間を伝える、自分の名前、電話番号を伝える★音声・復習テスト付き

    シーン別 タイ語<例文14件>レストランシリーズ全6回の1回目。予約。予約時間を伝える、自分の名前、電話番号を伝える★音声・復習テスト付き タイのレストランに行ったら、席に座って、料理を注文して、べて、お金を払ってという行動をとります。 もしかしたらレストランに行く前にお店に予約が必要かもしれません。 そんな時に使える使えるタイ語のフレーズを紹介します。 後半には、復習テストがありますので、ぜひトライしてください。

    タイ語<例文14件>レストランシリーズ全6回の1回目。予約。予約時間を伝える、自分の名前、電話番号を伝える★音声・復習テスト付き
    shidho
    shidho 2024/04/17
    問題は、電話越しに相手がそう言ってるかどうかを聞き取れるかどうかなのよ。
  • 「泥のように眠る」の「泥」は生物のことなのか?

    まず、土と水の混合物という意味での「泥」(以下「ドロ」と書く)ではない、生きものとしての「泥」(以下「デイ」と書く)については、中国唐代の沈如筠が書いた『異物志』という書物で紹介されているという。 泥为虫名。无骨,在水则活,失水则醉,如一堆泥。 泥は虫の名である。骨がなく、水に在ればすなわち活き、水を失えばすなわち酔う、一堆の泥のごとし。 南宋代の『能改斎漫録』、明代の『夜航船』などにも同様の記述が引き継がれている。なぜ「水を失えば酔う」のかといえば、言い伝えによると「デイ」は身体から酒を分泌しているので、周囲に水が無くなると自分の酒で酔って、ドロのようになって死んでしまうかららしい(が、この言い伝えのソースも不明なので信用できるかどうか)。おそらくナマコかクラゲのようなものを指しているのではないかと思われる。 「酔如泥(泥の如く酔う)」という表現の初出は『後漢書』の周沢伝だ……という説が

    「泥のように眠る」の「泥」は生物のことなのか?
    shidho
    shidho 2024/03/09
    「泥酔」と「泥睡」は日本語だと同じ読みだし、泥酔している人は大抵寝ているので、酔っ払って寝てる人を「泥酔してる」と指摘された時に「泥睡」だと勘違いしたのでは。カンガルーの語源と同じような。
  • 思念言語を使う異星人と人間の通訳官が、殺人事件に巻き込まれるSFミステリ長篇──『人類の知らない言葉』 - 基本読書

    人類の知らない言葉 (創元SF文庫) 作者:エディ・ロブソン東京創元社Amazonこの『人類の知らない言葉』はイギリスの作家にして〈ドクター・フー〉などの脚も手掛けるエディ・ロブソンによる、2022年に刊行されたSFミステリ長篇だ。近未来、テレパシー(思念言語)を用いて会話するロジ人が地球にやってきた世界を舞台とし、ロジ人と人間の通訳を務める女性のリディアを主人公に物語は進行していく。 緒賀岳志さんの装画もよく、装丁が全体的にかっこよかったので(あと、全米図書館協会RUSA賞のSF部門受賞作でもある)そこそこ期待して読み始めたが、これはおもしろかった! なにか具体的に突き抜けた点があるわけではないのだけど、異星人通訳という特殊な仕事の困難さをはじめとしたひとつひとつの描写や演出が丁寧で、作家の素晴らしい技術をみせてもらえたな、と安心して読めるエンタメ作品だ。 世界観、あらすじなど 最初に

    思念言語を使う異星人と人間の通訳官が、殺人事件に巻き込まれるSFミステリ長篇──『人類の知らない言葉』 - 基本読書
    shidho
    shidho 2023/05/19
    異星人との通訳というと、筒井康隆が「関節話法」を使う異星人との話をしすぎて倒れる話を書いてたな。最終的に地球人は言語障害で入院する。
  • タイ語 中子音字

    中子音字の覚え方 中子音字は、タイの学校で必ずと言っていいほど習う覚え方があります。 ไก่จิกเด็กตายบนปากโอ่ง ガイ チック デック ターイ ブン パーク オーン 「ニワトリが壺の(上の)淵にいる子供を突いて死にました」という意味です。 この言葉だけで中子音字を覚えることができます。 ไก่:ガイ(にわとり) จิก:チック(つつく) เด็ก:デック(子供) ตาย:ターイ(死) บน:ボン(上) ปาก:パーク(口) โอ่ง:オーン(壺・瓶) 有名な言葉だけあってYouTubeも多数公開されていますが、見た目で分かりやすい動画をチョイスし載せておきます。 (動画1分頃から) ไก่(ก)จิก(จ)เด็ก(ฎ)ตาย(ฏ)บน(บ)ปาก(ป)โอ่ง(อ) 動画内で「เด็กตาย:デックターイ」が繰り返され、2回目のเด็ก(デック)がฎに、ตาย(ターイ)

    タイ語 中子音字
    shidho
    shidho 2023/05/12
    一見法則性がないものの覚え方は語呂合わせが多いんだが、やっぱりこの分野にも語呂合わせが存在した。
  • タイ人のニックネーム・よくある名前について~タイ名前事情②~ | バンコクLABタイ語学校

    お気軽にお問い合わせください。labsk331@gmail.com受講対応時間 9:00 - 22:00 [ 長期休み除く ] お問い合わせはこちらお気軽にお問い合わせください。

    タイ人のニックネーム・よくある名前について~タイ名前事情②~ | バンコクLABタイ語学校
  • タイ人の苗字は長い&複雑!~タイ名前事情~ | バンコクLABタイ語学校

    タイ人の名前(名)は長いし複雑だし、、なぜタイ人の苗字は長いのか? サワディーカー (สวัสดีค่ะ こんにちは)! 日人にはなかなか発音が難しいタイ語。巻き舌、発音しない音、日にない音!大変ですよね。 そしてそれはタイの人名においても例外ではなく... いつもお世話になっているドライバーさん、ネイリストさんの名前が発音しにくい! そもそもなんでこんな複雑な名前?なんて、思ったことありませんか? そこで今回は、タイの人名についてご紹介します。 (*2020年9月8日追記:タイの日人ユーチューバーTop3のDayzeroさんが記事参考にして動画を作ってくれたようです!記事最後に動画追加) あわせて読みたい

    タイ人の苗字は長い&複雑!~タイ名前事情~ | バンコクLABタイ語学校
  • ベトナム人が分からなかった日本語について「日本に来たらなんとか理由を理解できた」言葉の文化は地域の特徴や価値観で解釈が変わる

    てりいまんⅤ @cityofBBB @vplusasia 日語の授業ですから日の習慣を伝えるのは当然ですが、教える側も日語を学ぶ外国人それぞれの習慣について興味を持って、その違いを楽しむような気持ちがあると、学生も更に高い学習意欲が持てると思います。ダメと否定だけされたらやる気無くしますね。 2023-04-03 09:50:41 Tran Van Quyen(チャン・バン.クエン) @vplusasia @cityofBBB 当時は「日人は厳しいな」と思い、「納得」しました。その後、日に来たら何とか理由を理解できました。しっかりしていた先生でしたが、多分先生も違う部分に気づいていなかったかもしれません。言葉の裏にある文化も教えた方が覚えやすいですね。 2023-04-03 10:04:37

    ベトナム人が分からなかった日本語について「日本に来たらなんとか理由を理解できた」言葉の文化は地域の特徴や価値観で解釈が変わる
    shidho
    shidho 2023/04/06
    地域依存であることは、南の島のカメハメハ大王で子供たちが雨が理由で学校を休むことが驚きであると歌われることからわかる、が、それは古い考えでもあるわな。あの歌もそう驚かない風に歌っているし。
  • タイ語がもっと身近な存在に 古い中国語由来のタイ語を紹介  | アジアトラベルノート

    タイ語は中国語を語源とする言葉が多く、クイティアオ(ก๋วยเตี๋ยว)やバミー(บะหมี่)などのように移民によって持ち込まれた比較的新しい単語だけでなく、上古中国語(Old Chinese)や中古中国語(Middle Chinese)といった古い時代にタイ語に取り入れられ既に借用語と意識されることなく使われている言葉も非常に多いのが特徴です。 今回は後者の古漢語に由来するタイ語を紹介。中国語の古語は現在とは発音が大きく異なるケースも多々ありますが、ここでは主に日語からも連想しやすい単語を中心に取り上げてみました。 元になった中国語→タイ語→発音→発音カタカナ表記→日語の意味、の順で表記しています。 幾 กี่ [kìi] キー 幾つか 益 อีก [ìik] イー(ク) さらに、再び 愚 โง่ [ŋôo] ンゴー 愚かな 真 จริง [ciŋ] チン(グ) 当の、物の

    タイ語がもっと身近な存在に 古い中国語由来のタイ語を紹介  | アジアトラベルノート
    shidho
    shidho 2023/02/22
    思ったより同源っぽい言葉があるな。
  • 旦那って言い方がおぞましすぎる

    なんでみんなこれに疑問を抱いていないのかわからない。 旦那って何?配偶者の女性は奴隷かなんかですか? 旦那って主従関係の時に使う言葉だよね? なんで平然と結婚した夫婦に使ってるの? なんで当たり前みたいに男が「上」なの? 店で「旦那様」と言う店員にも腹立つし、自分から配偶者の男のことを「うちの旦那が」と言ってるのも気持ち悪くて仕方ない。 この意見言うと「気にしすぎだ」って言う阿保が沢山出てくるのも腹立つ。こうした無意識のミソジニーが積み重なって男尊女卑が続いてるのが日だろうが。 結局、こういう言葉を気にせず使う/修正しようともしない時点で、日の男や一部女性達は男尊女卑を変える気がないんだなって絶望する。 一生奴隷扱いでいい、そういう烙印なんだと思う。

    旦那って言い方がおぞましすぎる
    shidho
    shidho 2023/01/26
    二股かけるんだよ。旦那とヒモ。旦那とヒモ。僕が僕らしくあるために、な。好きなこと好きだと言える気持ち大切にな。(結果、ひどい替え歌になってしまった)
  • 日本では英語ペラペラだと思われる「TOEIC900点」ってネイティブの英語力に換算するとこのくらいです「そうなの!?」

    川田耕作 @kawata_tenshoku 日では英語ペラペラと思われるTOEIC900点は、英語ネイティブの英語能力を100とすると、15くらいです。これ決して大袈裟ではないです 2022-10-31 21:27:25 リンク Wikipedia 国際コミュニケーション英語能力テスト 国際コミュニケーション英語能力テスト(こくさいコミュニケーションえいごのうりょくテスト、英: Test of English for International Communication))とは、英語によるコミュニケーションとビジネス能力を検定するための試験。評価はスコアの数値で行われ、スコアの満点は990点。 TOEIC(トーイック)という商品名(登録商標)でアメリカのテスト開発機関である教育試験サービス(ETS)が試験の開発、運営、評価を行っている。TOEICという名称は、受験した人に与えられた認定

    日本では英語ペラペラだと思われる「TOEIC900点」ってネイティブの英語力に換算するとこのくらいです「そうなの!?」
    shidho
    shidho 2022/11/09
    外人が日本語能力の最高峰だと信じてるJLPT N1だって、中学生の国語の教科書がようやっと読めるレベルだからな。日本語のレベルで考えるとTOEIC900とさほど変わらない。