コンテンツにスキップ

基本ラテン文字 (Unicodeのブロック)

出典: フリー百科事典『ウィキペディア(Wikipedia)』
基本ラテン文字
C0 Controls and Basic Latin
範囲 U+0000..U+007F
(128 個の符号位置)
基本多言語面
用字 ラテン文字(52文字)
Common(76文字)
記号集合 アラビア数字
約物
主な言語・文字体系 英語
フランス語
スペイン語
ドイツ語
ベトナム語
割当済 128 個の符号位置
33 個の制御文字または書式文字
未使用 0 個の保留
元となった標準規格 ISO/IEC 8859, ISO 646
Unicodeのバージョン履歴
1.0.0 128 (+128)
公式ページ
コード表 ∣ ウェブページ
備考: [1][2]
テンプレートを表示

基本ラテン文字(きほんラテンもじ、英語: Basic Latin)は、Unicodeの1つ目のブロックである。ASCII文字コードの全ての文字(基本ラテン文字制御文字)が、同じ順番・同じコードで収録されている。C0制御文字及び基本ラテン文字(C0 Controls and Basic Latin)ともいう。UTF-8において、収録されたキャラクタが1バイトで表現できる唯一のブロックである。

基本ラテン文字ブロックはUnicode バージョン1.0.0から最新のバージョンまでの全てに含まれ、その間文字の追加・変更が行われていない[3]

収録文字

[編集]
コード 文字 文字名(英語) 説明 略号
C0制御文字
U+0000 Null character ヌル文字 NUL
U+0001 Start of Heading ヘッディング開始 SOH
U+0002 Start of Text テキスト開始 STX
U+0003 End-of-text character テキスト終結 ETX
U+0004 End-of-transmission character 伝送終了 EOT
U+0005 Enquiry character 問い合わせ文字 ENQ
U+0006 Acknowledge character 肯定応答文字 ACK
U+0007 Bell character ベル文字 BEL
U+0008 Backspace 後退 BS
U+0009 Horizontal tab 水平タブ HT
U+000A Line feed 改行 LF
U+000B Vertical tab 垂直タブ VT
U+000C Form feed 書式送り FF
U+000D Carriage return 復帰 CR
U+000E Shift Out シフトアウト SO
U+000F Shift In シフトイン SI
U+0010 Data Link Escape 伝送制御拡張 DLE
U+0011 Device Control 1 装置制御1 DC1
U+0012 Device Control 2 装置制御2 DC2
U+0013 Device Control 3 装置制御3 DC3
U+0014 Device Control 4 装置制御4 DC4
U+0015 Negative-acknowledge character 否定応答 NAK
U+0016 Synchronous Idle 同期文字 SYN
U+0017 End of Transmission Block 伝送ブロック終結 ETB
U+0018 Cancel character キャンセル文字 CAN
U+0019 End of Medium 媒体終結 EM
U+001A Substitute character 置換文字 SUB
U+001B Escape character エスケープ文字 ESC
U+001C File Separator ファイル分離文字 FS
U+001D Group Separator グループ分離文字 GS
U+001E Record Separator レコード分離文字 RS
U+001F Unit Separator ユニット分離文字 US
ASCIIの約物と記号
U+0020   Space スペース SP
U+0021 ! Exclamation mark 感嘆符
U+0022 " Quotation mark 引用符
U+0023 # Number sign 番号記号
U+0024 $ Dollar sign ドル記号
U+0025 % Percent sign パーセント記号
U+0026 & Ampersand アンパサンド
U+0027 ' Apostrophe アポストロフィー
U+0028 ( Left parenthesis 開き丸括弧
U+0029 ) Right parenthesis 閉じ丸括弧
U+002A * Asterisk アスタリスク
U+002B + Plus sign プラス記号
U+002C , Comma コンマ
U+002D - Hyphen-minus ハイフンマイナス
U+002E . Full stop or period 終止符
U+002F / Solidus or Slash スラッシュ
ASCIIの数字
U+0030 0 Digit Zero 0
U+0031 1 Digit One 1
U+0032 2 Digit Two 2
U+0033 3 Digit Three 3
U+0034 4 Digit Four 4
U+0035 5 Digit Five 5
U+0036 6 Digit Six 6
U+0037 7 Digit Seven 7
U+0038 8 Digit Eight 8
U+0039 9 Digit Nine 9
ASCIIの約物と記号
U+003A : Colon コロン
U+003B ; Semicolon セミコロン
U+003C < Less-than sign 不等号(より小)
U+003D = Equal sign 等号
U+003E > Greater-than sign 不等号(より大)
U+003F ? Question mark 疑問符
U+0040 @ At sign or Commercial at 単価記号
大文字のラテン文字
U+0041 A Latin Capital letter A ラテン文字の大文字のA
U+0042 B Latin Capital letter B ラテン文字の大文字のB
U+0043 C Latin Capital letter C ラテン文字の大文字のC
U+0044 D Latin Capital letter D ラテン文字の大文字のD
U+0045 E Latin Capital letter E ラテン文字の大文字のE
U+0046 F Latin Capital letter F ラテン文字の大文字のF
U+0047 G Latin Capital letter G ラテン文字の大文字のG
U+0048 H Latin Capital letter H ラテン文字の大文字のH
U+0049 I Latin Capital letter I ラテン文字の大文字のI
U+004A J Latin Capital letter J ラテン文字の大文字のJ
U+004B K Latin Capital letter K ラテン文字の大文字のK
U+004C L Latin Capital letter L ラテン文字の大文字のL
U+004D M Latin Capital letter M ラテン文字の大文字のM
U+004E N Latin Capital letter N ラテン文字の大文字のN
U+004F O Latin Capital letter O ラテン文字の大文字のO
U+0050 P Latin Capital letter P ラテン文字の大文字のP
U+0051 Q Latin Capital letter Q ラテン文字の大文字のQ
U+0052 R Latin Capital letter R ラテン文字の大文字のR
U+0053 S Latin Capital letter S ラテン文字の大文字のS
U+0054 T Latin Capital letter T ラテン文字の大文字のT
U+0055 U Latin Capital letter U ラテン文字の大文字のU
U+0056 V Latin Capital letter V ラテン文字の大文字のV
U+0057 W Latin Capital letter W ラテン文字の大文字のW
U+0058 X Latin Capital letter X ラテン文字の大文字のX
U+0059 Y Latin Capital letter Y ラテン文字の大文字のY
U+005A Z Latin Capital letter Z ラテン文字の大文字のZ
ASCIIの約物と記号
U+005B [ Left Square Bracket 開き角括弧
U+005C \ Backslash バックスラッシュ [A]
U+005D ] Right Square Bracket 閉じき角括弧
U+005E ^ Circumflex accent サーカムフレックス
U+005F _ Low line アンダースコア
U+0060 ` Grave accent グレイヴ・アクセント
小文字のラテン文字
U+0061 a Latin Small Letter A ラテン文字の小文字のA
U+0062 b Latin Small Letter B ラテン文字の小文字のB
U+0063 c Latin Small Letter C ラテン文字の小文字のC
U+0064 d Latin Small Letter D ラテン文字の小文字のD
U+0065 e Latin Small Letter E ラテン文字の小文字のE
U+0066 f Latin Small Letter F ラテン文字の小文字のF
U+0067 g Latin Small Letter G ラテン文字の小文字のG
U+0068 h Latin Small Letter H ラテン文字の小文字のH
U+0069 i Latin Small Letter I ラテン文字の小文字のI
U+006A j Latin Small Letter J ラテン文字の小文字のJ
U+006B k Latin Small Letter K ラテン文字の小文字のK
U+006C l Latin Small Letter L ラテン文字の小文字のL
U+006D m Latin Small Letter M ラテン文字の小文字のM
U+006E n Latin Small Letter N ラテン文字の小文字のN
U+006F o Latin Small Letter O ラテン文字の小文字のO
U+0070 p Latin Small Letter P ラテン文字の小文字のP
U+0071 q Latin Small Letter Q ラテン文字の小文字のQ
U+0072 r Latin Small Letter R ラテン文字の小文字のR
U+0073 s Latin Small Letter S ラテン文字の小文字のS
U+0074 t Latin Small Letter T ラテン文字の小文字のT
U+0075 u Latin Small Letter U ラテン文字の小文字のU
U+0076 v Latin Small Letter V ラテン文字の小文字のV
U+0077 w Latin Small Letter W ラテン文字の小文字のW
U+0078 x Latin Small Letter X ラテン文字の小文字のX
U+0079 y Latin Small Letter Y ラテン文字の小文字のY
U+007A z Latin Small Letter Z ラテン文字の小文字のZ
ASCIIの約物と記号
U+007B { Left Curly Bracket 開き中括弧
U+007C | Vertical bar バーティカルバー
U+007D } Right Curly Bracket 閉じ中括弧
U+007E ~ Tilde チルダ
制御文字
U+007F Delete 削除文字 DEL
A  U+005C(\)は、日本語フォントでは円記号、韓国語フォントではウォン記号として表示される場合がある[4]。この表ではこれらのフォントでもバックスラッシュとして表示されるようにしてある。

小分類

[編集]

このブロックには6つの小分類(subheading)がある[5]

C0制御文字

[編集]

C0制御文字英語版は、Unicodeバージョン1.0では「C0 ASCII制御文字(C0 ASCII control codes)」と呼ばれ、ASCIIや他の7ビット・8ビット文字コードから継承されている。英語の文字名はISO/IEC 6429:1992から取られている[5]

ASCIIの約物と記号

[編集]

この小分類には、英文における標準的な約物、単純な数学記号、ドル記号・パーセント・アンパサンド・アンダースコア・パイプなどの記号が含まれている[5]

ASCIIの数字

[編集]

この小分類には、1-9および0のアラビア数字が含まれている[5]

大文字のラテン文字

[編集]

この小分類には、標準的な26文字のアクセントのない大文字のラテン文字が含まれている[5]

小文字のラテン文字

[編集]

この小分類には、標準的な26文字のアクセントのない小文字のラテン文字が含まれている[5]

制御文字

[編集]

「制御文字」小分類には削除文字(DEL)のみが含まれている[5]

文字コード表

[編集]
C0制御文字及び基本ラテン文字(C0 Controls and Basic Latin)[1]
Official Unicode Consortium code chart (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+000x  NUL   SOH   STX   ETX   EOT   ENQ   ACK   BEL    BS     HT     LF     VT     FF     CR     SO     SI  
U+001x  DLE   DC1   DC2   DC3   DC4   NAK   SYN   ETB   CAN    EM    SUB   ESC    FS     GS     RS     US  
U+002x   SP   ! " # $ % & ' ( ) * + , - . /
U+003x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
U+004x @ A B C D E F G H I J K L M N O
U+005x P Q R S T U V W X Y Z [ \ ] ^ _
U+006x ` a b c d e f g h i j k l m n o
U+007x p q r s t u v w x y z { | } ~  DEL 
備考
1.^ Unicode バージョン 9.0 現在

絵文字

[編集]

基本ラテン文字ブロックには、U+0023, U+002A, U+0030–U+0039の12文字の絵文字が含まれている[6][7]。これらは、U+20E3 combining enclosing keycapと組み合わせて電話機の押しボタンを表す(例: #️⃣ (U+0023 NUMBER SIGN U+FE0F VS16 U+20E3 COMBINING ENCLOSING KEYCAP) )

この12文字に対し2種類の異体字セレクタ、絵文字表示(U+FE0F VS16)かテキスト表示(U+FE0E VS15)が適用できる。いずれも、デフォルトはテキスト表示である[8]

絵文字の異体字シーケンス
U+ 0023 002A 0030 0031 0032 0033 0034 0035 0036 0037 0038 0039
base code point # * 0 1 2 3 4 5 6 7 8 9
base+VS15 (text) #︎ *︎ 0︎ 1︎ 2︎ 3︎ 4︎ 5︎ 6︎ 7︎ 8︎ 9︎
base+VS16 (emoji) #️ *️ 0️ 1️ 2️ 3️ 4️ 5️ 6️ 7️ 8️ 9️

履歴

[編集]

以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。

バージョン コードポイント[a] 文字数 L2 ID WG2 ID ドキュメント
1.0.0 U+0000..007F 128 (to be determined)
L2/04-145 Starner, David (2004-04-30), C with stroke character examples from BAE report 1884 (Dorsey) 
L2/04-202 Anderson, Deborah (2004-06-07), Slashed C Feedback 
L2/11-043 Freytag, Asmus; Karlsson, Kent (2011-02-02), Proposal to correct mistakes and inconsistencies in certain property assignments for super and subscripted letters 
L2/11-160 PRI #181 Changing General Category of Twelve Characters, (2011-05-02) 
L2/11-438[b][c] N4182 Edberg, Peter (2011-12-22), Emoji Variation Sequences (Revision of L2/11-429) 
L2/15-268 Beeton, Barbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray (2015-10-30), Proposal to Represent the Slashed Zero Variant of Empty Set 
L2/15-301[d][c] Pournader, Roozbeh (2015-11-01), A proposal for 278 standardized variation sequences for emoji 
  1. ^ 提案されたコードポイントと文字の名前は、最終決定と異なる場合がある。
  2. ^ L2/10-458, L2/11-414, L2/11-415, L2/11-429も参照。
  3. ^ a b 追加の絵文字関連のドキュメントについては、その他の記号及び絵記号歴史節を参照。
  4. ^ L2/15-198, L2/15-275も参照。

関連項目

[編集]

出典

[編集]
  1. ^ Unicode character database”. The Unicode Standard. 2016年7月9日閲覧。
  2. ^ Enumerated Versions of The Unicode Standard”. The Unicode Standard. 2016年7月9日閲覧。
  3. ^ The Unicode Standard Version 1.0, Volume 1. Addison-Wesley Publishing Company, Inc.. (1990). ISBN 0-201-56788-1 
  4. ^ Sorting it all Out : When is a backslash not a backslash?
  5. ^ a b c d e f g Unicode 6.2 code charts”. The Unicode Standard. 1 April 2013閲覧。
  6. ^ UTR #51: Unicode Emoji”. Unicode Consortium (2016年11月22日). 2016年12月16日閲覧。
  7. ^ UCD: Emoji Data for UTR #51”. Unicode Consortium (2016年11月14日). 2016年12月16日閲覧。
  8. ^ Unicode Character Database: Standardized Variation Sequences”. The Unicode Consortium. 2016年12月16日閲覧。

外部リンク

[編集]