タグ

文字に関するitochanのブックマーク (9)

  • キリル文字筆記体を制せよ:筆記体で読み書きできるとテュル活も捗る【新学期特集】|テュルク友の会

    イセンメセズ!(タタール語で"こんにちは") ところで現代タタール語は、全39字からなるキリル文字を導入しています。上述のあいさつは《Исәнмесез》と綴られます。 タタールスタンの映画監督イルダル・ヤガファロフ氏による映画「イセンメセズーー生きているか」のポスター。映画はタタール文化やタタール性にも踏み込み、これらが「生きているか」問うものでもあったことから、昨年タタール世界では大きく話題になった。 それはともかく、映画タイトルにもなっている「Исәнмесез?」を斜字体で綴った例。 ちょっと前のめりになってしまいました。タタ村(@tatamullina)です。 今回はキリル文字の話ーーとくに、キリル文字で綴る言語を学び始めた人がつまずきやすい「キリル文字筆記体」を取り上げたいと思います。 なぜあえて「筆記体」かといえば、筆記体はブロック体を書く2〜3倍のスピードで書字できるので、

    キリル文字筆記体を制せよ:筆記体で読み書きできるとテュル活も捗る【新学期特集】|テュルク友の会
    itochan
    itochan 2022/09/15
    「Т(т)」がどうしてこうなるのか不思議
  • 文字列を反転させたい|nona

    こんにちは。徒然なるままにTweetを眺めていたら、Tanakaさんがこのようなことを呟いていました。 そういやRustのStringにreverseメソッドないなと思ったけど、まあよく考えたらUTF-8で文字逆転させるとか地獄のような話になるしそもそも長さが変わるケースとかあったりしそうで怖いわな・・・(´・_・`) — Hideyuki Tanaka (@tanakh) May 1, 2021 背景等はよくわからないですが、文字列の反転というのは確かに難しい問題ですし、どう難しいのかというのを、ちょっと真面目に考えて解説してみました。というノートです。 文での表記についてこれから文字とそのバイト表現の話をしていきます。文字のエンコードの方式で同じ数値でも色々意味が分かれてしまいますので、文では以下のように表記することにします。 Unicodeコードポイント(以下、単にコードポイント

    文字列を反転させたい|nona
  • JavaScript における文字コードと「文字数」の数え方 | blog.jxck.io

    Intro textarea などに入力された文字数を、 JS で数えたい場合がある。 ここで .length を数えるだけではダメな理由は、文字コードや JS の内部表現の話を理解する必要がある。 多言語や絵文字対応なども踏まえた上で、どう処理するべきなのか。 それ自体は枯れた話題ではあるが、近年 ECMAScript に追加された機能などを交えて解説する。 なお、文字コードの仕組みを詳解すること自体が目的では無いため、 BOM, UCS-2, Endian, 歴史的経緯など、この手の話題につき物な話の一部は省くこととする。 1 文字とは何か Unicode は全ての文字に ID を振ることを目的としている。 例えば 😭 (loudly crying face) なら 0x1F62D だ。 1 つの文字に 1 つの ID が割り当てられているのだから、文字の数を数える場合は、この ID

    JavaScript における文字コードと「文字数」の数え方 | blog.jxck.io
  • #日本語ハッシュタグ で使える文字、使えない文字

    ツイッターで日語ハッシュタグが使えるようになりましたが、長音記号やサロゲートペアなど、使えない文字が多々あったので、それについての試行錯誤の記録です。 おまけとして、多言語TLD についても。 2011.7.17 追記 続きを読む

    #日本語ハッシュタグ で使える文字、使えない文字
  • Leet - Wikipedia

    leet(リート、1337、l33t)は、主に英語圏においてインターネット上で使われるアルファベットの表記法である。leetspeak(リートスピーク)とも呼ばれる。 leet は、英語の elite(エリート)が eleet に変化し、さらに語頭の e がとれてできた俗語である。日ではハッカー語と呼ばれることもある。 たとえば、「Warez」という語を leet で表記すると、「W@rez」や「W4r3z」などとなるように、一部のアルファベットを形の似たアラビア数字や記号などに変化させる。 表記法は、「for」や「to」をそれぞれ似た発音の「4」や「2」で代用したり、同様に「you」を「u」と置き換えたり、複数形の「s」を「z」に変えたり、「cks」または「ks」で終わる単語を「x」に差し替えたり、故意に綴りを誤って表記したり、大文字と小文字を混在させたりするなど、多様である。 lee

  • 画像ファイルをメールで送るだけでOCRで読み取ってくれる「n1ne@freeOCR」

    Warning: include_once(/home/sites/lolipop.jp/users/lolipop.jp-dp16105308/web/wp/wp-content/plugins/wp-super-cache/wp-cache-phase1.php): failed to open stream: Permission denied in /home/users/0/lolipop.jp-dp16105308/web/wp/wp-content/advanced-cache.php on line 8 Warning: include_once(): Failed opening '/home/sites/lolipop.jp/users/lolipop.jp-dp16105308/web/wp/wp-content/plugins/wp-super-cache/wp-c

    画像ファイルをメールで送るだけでOCRで読み取ってくれる「n1ne@freeOCR」
    itochan
    itochan 2010/04/05
    OCR
  • 覚えておきたい漢字の筆順(書き順) - Paroday

    ▲ 補足 書き順の基は「上から下」「左から右」「十字は横線が先」「『人』や『メ』は『ノ』が先」です。エントリーでは、注意すべき(例外的な)漢字をピックアップしています。 時代とともに書き順が変化したものや書き順が1つではない漢字もあるようです。また、書体によって書き順や画数が変わるものもあります。エントリーは”間違いではない書き順”であって、絶対的なものではありません。 恐らく大部分の漢和辞典では、「離」の画数は19画(左側が11画、右側[隹]が8画)になっています。これは「ム」の部分を3画とする慣例によるものだそうです。同じように「璃」も4+11=15画となります。 ※日漢字教育振興会の漢検漢字辞典では「離」を18画、「璃」を15画としています。 更新履歴・参考 2009.06.07 常用漢字中心に再編集。 「舳」「發」「觜」「韋」「饉」の削除。 桎梏となるため、タイトルから個数

    itochan
    itochan 2009/05/26
    だいたいあってた
  • 2007年12月: ほぼ文字についてだけのブログ

    隷書や楷書のくさかんむりには、AタイプとBタイプがあり、Aタイプのくさかんむりの下に「者」を書いたのが「著」、Bタイプのくさかんむりの下に「者」を書いたのが「着」にすぎない。 もともと「著」も「着」も同じ字であり、区別がなかった。 これらがいつごろから使い分けられるようになったのかはわからないが、遅くとも江戸時代には、「著」は書物を著す・著書、「着」は到着・着物として使い分けが見られる。 「著=着」はAタイプ、Bタイプ両方のくさかんむりが使われるが、どちらかに決まっている字もある。「苦」はAタイプ、「若」はBタイプである。これは似た字なのでくさかんむりの使い分けが生じたのであろう。 「齊藤」「斎藤」「斉藤」「齊藤」さんの由来について、さらに補足する。 「斎藤」は、藤原利仁の次男、藤原叙用が斎宮頭になったときに「斎藤」と称したのを起源とするらしい。この説が当なら、これは10世紀(平安時代中

    itochan
    itochan 2009/05/26
    着と著は元は同じ字  斉の右下縦棒は最後
  • File:Vergleich zh-Hant-CN zh-Hant-TW ja-Hani ko-Hani.svg - Wikimedia Commons

    Size of this PNG preview of this SVG file: 490 × 349 pixels. Other resolutions: 320 × 228 pixels | 640 × 456 pixels | 1,024 × 729 pixels | 1,280 × 912 pixels | 2,560 × 1,823 pixels.

    File:Vergleich zh-Hant-CN zh-Hant-TW ja-Hani ko-Hani.svg - Wikimedia Commons
    itochan
    itochan 2009/05/26
    字形の違い ほかにもあるのかな?
  • 1