タグ

utf8に関するskyriserのブックマーク (5)

  • utf8_unicode_ci に対する日本の開発者の見解 - かみぽわーる

    RailsMySQLのcollationをサーバー側のデフォルトのutf8_general_ciからutf8_unicode_ciにわざわざ変えてるのどうせ大した理由じゃないだろと思って掘ってみたらやっぱり大した理由じゃなかった… https://t.co/6NeetGhTF0— Ryuta Kamizono (@kamipo) April 18, 2014 Railsでcollationとしてutf8_unicode_ci(RailsのDEFAULT_COLLATION)が採用されるのはcharsetが未指定もしくはutf8(RailsのDEFAULT_CHARSET)のときだけで、utf8mb4にすることとかは全く考慮されてない。— Ryuta Kamizono (@kamipo) April 19, 2014 @frsyuki MySQLのcharset utf8のときのデフォルト

    utf8_unicode_ci に対する日本の開発者の見解 - かみぽわーる
  • 機種依存文字の変換:ねこすけのPHP

    memo.xight.org - UTF-8で変換できない機種依存文字を置換する UTF-8 のページから (株) や ローマ数字の I などの文字をメールで送信すると,文字化けする. 文字化けしそうな文字を,ad hoc に機種依存しない文字に変換する. ローマ数字もカッコで括るか,スペースを挿入したほうが良いかも. UTFで作ったメール送信フォームでよく文字化けしていました。 機種依存文字を使うなと思っていても、利用者は一向に減りません。 半角カタカナは全角にする処理を入れていたのですが、機種依存文字はそのままにしておりました。 参考になります。 ソースはオリジナルからよくきたブログさんで指摘されている部分を変更したものです。 function replaceText($str){ $ret = $str; $arr = array( '\xE2\x85\xA0' => 'I', '\

    skyriser
    skyriser 2009/05/22
    お。これは素晴らしい。
  • 試験管のなかのコード :: MySQL の文字エンコーディング関連設定

    MySQL の文字エンコーディング関連設定 Windows で開発して Linux で稼働させる、といった状況だと文字エンコーディングは UCS2 や UTF-8 にしておくと楽。 MySQLUTF-8 で動作させるための設定方法をメモしておく。 4.1.2. my.cnf オプション設定ファイル http://dev.mysql.com/doc/refman/4.1/ja/option-files.html 付録 F. 環境変数 http://dev.mysql.com/doc/refman/4.1/ja/environment-variables.html 9.3.6. 接続のキャラクタセットおよび照合順序 http://dev.mysql.com/doc/refman/4.1/ja/charset-connection.html ぱんぴーまっしぐら - PHPMySQLの個人

  • UTF-8とUTF16の違いは?

    XML文書で使える漢字コードとして、UTF-8とUTF-16というのがありますが、この2つはどのように違っているのですか? 使い分ける必要はありますか? 回答/富士ソフトABC株式会社 技術センター 2001/9/14 UTF-8とUTF16の違いを一言でいうと、文字を表現するときの単位が違います。UTF-8は8ビットの可変長マルチバイトで文字を表現し、UTF-16は16ビットの可変長マルチバイトで文字を表現します。 それぞれの定義については以下のように少し難しい表現が使われています。 UTF-8 (8-bit UCS Transformation Format) UCS-2で定義される文字集合を用いて記述された文字列をバイト列に変換する方式の1つ。1文字を1~6バイトの可変長マルチバイトに変換する。UTF-16 (16-bit UCS Transformation Format): UC

  • 徒然ぶろぐ > PuTTY + screen で日本語入力を可能にする

    デフォルトのままでは日本語入力をすると文字化けてしまう。 PuTTY 編 言わずもがなことですが、言語設定をしましょう。私の環境は UTF-8 なので、かつ日語が通る必要があるので「UTF-8 (CJK)」にしておきます。 PuTTY の言語設定 ターミナル編 続いてターミナルの設定を行う。私の環境 (Debian etch) では大丈夫でしたが、以下のコマンドを実行し、文字の 8 ビット目が正しく入力できるようにする。 8 ビット文字を入力できるようにする% stty pass8 設定状況は -a オプションで見ることができる。このとき -parenb -istrip cs8 が含まれていれば良い。 stty -a したところ% stty -a speed 38400 baud; rows 50; columns 80; line = 0; intr = ^C; quit = ^\;

  • 1