タグ

utf8に関するm_shige1979のブックマーク (2)

  • MySQL で utf8 と utf8mb4 の混在で起きること - tmtms のメモ

    MySQLUTF-8 で使おうと思ってハマりがちなのは charset utf8 を指定してしまうことです。 MySQLUTF-8 には歴史的事情により utf8 と utf8mb4 の二つあります。 UTF-8 は1バイト〜4バイトで1文字が構成される文字コードですが、MySQL の utf8 は4バイト文字を扱うことができません。ハマりたくなければ utf8mb4 を使いましょう。 utf8 を使ってしまった場合に4バイト文字がどのように扱われるか、自分でもうろ覚えだったのでメモしておきます。 登録 接続が utf8mb4 でカラムが utf8mb4 あたりまえですが、そのまま登録されます。 mysql> insert into utf8mb4 (c) values ('美味しい🍣と🍺'); mysql> select * from utf8mb4; +--------

    MySQL で utf8 と utf8mb4 の混在で起きること - tmtms のメモ
  • use utf8は書くべきなのか? - Qiita

    ソースファイルの文字コードがutf8だからといってuse utf8するのは違うらしい 毎回use utf8して、binmode(STDOUT, ":utf8")、binmode(STDIN, ":utf8");してたけど そういうことじゃないのね。 use utf-8はほとんどの場合不要。 perlメモ http://www.rengoku.sakura.ne.jp/program/perl/perl_utf8_001.html じゃあ何のためにあるのかと言えば、perlの処理側に、これはUNICODE文字として処理するよと教えるだけの物です。 具体的に書くと、substr(文字分割)、length(文字の長さ取得)と言うような、UNICODEとマルチバイトで動作が変る関数群などに対して、 どちらの処理方法で処理するかを教えるのがutf8フラグとなります。 たとえばlengthの場合、フラ

    use utf8は書くべきなのか? - Qiita
  • 1