タグ

2017年1月4日のブックマーク (3件)

  • Shift_JIS 文字コード表

    注 このページはWindowsMeというOSでJavaの学習をしていた時代にファイル内の文字コードを見るときの参考に書かれものです。ページの文字コードもShift_JISのままにしてあります。 このページで説明している文字コードは、JIS X 0208 にNEC選定IBM拡張文字とIBM拡張文字を加えたものです。最近では拡張文字を含んだものをwindows-31jとかCP932とよんで、Shift_JISは拡張文字を含まない場合をいう傾向にあります。 Windows7から JIS X 0213 に対応しましたが、これをShift_JIS(Shift_JIS:2004)にすると拡張文字の部分が0213で追加された文字とは衝突します。Windowsでは互換性の確保の観点からShift_JISのテキストファイルはWindows-31jにしますから、ここに書かれた情報はいまでも合致するはずです。た

  • 人名用漢字と文字コードの対応表

    人名用漢字と文字コード(JIS X 0213、Unicode)の対応表を、機械可読なCSV形式で用意しました。2010年の常用漢字表改定に伴う変更を反映しています。現時点では861文字を含んでいます。 文字コードとしては、JIS X 0213の面区点番号、7ビットコード(GL)、EUC-JIS-2004のコード(GR)、SJISコード(Shift_JIS-2004)、および、 ISO/IEC 10646 UCS (Unicode)の符号位置のそれぞれについて記しています。 ダウンロード: (下の3つのリンクは同一の内容で、ファイルの文字コードだけが違います) UTF-8版の人名用漢字コード表 EUC-JIS-2004版の人名用漢字コード表 Shift_JIS-2004版の人名用漢字コード表 この対応表は第3水準漢字を含んでいます。したがって、JIS第3・第4水準に対応した環境でご利用くださ

  • fudist - UTF-8 → cp932(Shift_JIS)変換表

    UTF-8にはcp932(Shift-JIS)に存在しない文字があるため、cp932(Shift_JIS)前提のシステムで使用することができないことがあります。 基的に ♥ ♠ ♦ ♣ のようにcp932(Shift_JIS)に存在しない記号は (はぁと) や外字などへ適当に変換するしかありません。 ただし実際にはcp932(Shift_JIS)でも置換可能な文字だけが問題で変換エラーになっているケースが多数あります。 ページでは文書ファイルをUTF-8からcp932(Shift-JIS)に変換するとき単純置換してさほど問題ない文字の対応表を記します。 cp932(Microsoft定義のShift_JIS) と Shift_JIS とは厳密に言うと ~ など一部の文字コードが異なります。 このためWindowsLinuxでunicode(UTF-8)へ変換した場合異なる文字コードに