Основная латиница
Основная латиница или Управляющие символы C0 и основная латиница (англ. Basic Latin, C0 Controls and Basic Latin) — первый блок стандарта Юникод и единственный блок, кодируемый одним байтом в системе UTF-8. Блок содержит все буквы и управляющие коды из кодировки ASCII.
Управляющие символы C0 и основная латиница | |
---|---|
англ. C0 Controls and Basic Latin | |
Диапазон |
0000—007F (128 кодовых позиций) |
Плоскость | BMP |
Письменности |
Латиница (52 символа) Общая (76 символов) |
Основные алфавиты |
Английский Французский Испанский Немецкий Вьетнамский |
Основные стандарты | ISO 8859, ISO 646 |
Кодовые позиции | |
Задействовано |
128 кодовых позиций 33 спецсимвола |
Зарезервировано | 0 кодовых позиций |
История изменений символов в Юникоде | |
1.0.0 | 128 (+128) |
Примечания: [1][2] | |
Официальный документ Юникода |
Основной блок латиницы был включён в нынешнюю версию Юникода из версии 1.0.0 без добавления или изменения набора символов[3].
Список символовПравить
Код | Символ | Название | Описание | Характеристики в Юникоде | Версия, в которой был добавлен символ |
Акроним | HTML | |||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
Категория символа |
Класс комбини- руемости |
Класс направ- ления |
Тип разрыва строки |
Мнемо- ника |
16-чный | 10-чный | ||||||
Управляющие символы C0 | ||||||||||||
U+0000 | <control-0000> | Пустой символ | Cc | 0 | BN | CM | 1.0.0 | NUL | — | � | � | |
U+0001 | <control-0001> | Начало заголовка | Cc | 0 | BN | CM | 1.0.0 | SOH | — |  |  | |
U+0002 | <control-0002> | Начало текста | Cc | 0 | BN | CM | 1.0.0 | STX | — |  |  | |
U+0003 | <control-0003> | Конец текста | Cc | 0 | BN | CM | 1.0.0 | ETX | — |  |  | |
U+0004 | <control-0004> | Конец передачи | Cc | 0 | BN | CM | 1.0.0 | EOT | — |  |  | |
U+0005 | <control-0005> | Запрос | Cc | 0 | BN | CM | 1.0.0 | ENQ | — |  |  | |
U+0006 | <control-0006> | Подтверждение | Cc | 0 | BN | CM | 1.0.0 | ACK | — |  |  | |
U+0007 | <control-0007> | Звуковой сигнал | Cc | 0 | BN | CM | 1.0.0 | BEL | — |  |  | |
U+0008 | <control-0008> | Возврат на шаг | Cc | 0 | BN | CM | 1.0.0 | BS | — |  |  | |
U+0009 | <control-0009> | Горизонтальная табуляция | Cc | 0 | S | BA | 1.0.0 | HT | 	 | 	 | 	 | |
U+000A | <control-000A> | Перевод строки | Cc | 0 | B | LF | 1.0.0 | LF | 
 | 
 | | |
U+000B | <control-000B> | Вертикальная табуляция | Cc | 0 | S | BK | 1.0.0 | VT | — |  |  | |
U+000C | <control-000C> | Прогон страницы, смена страницы | Cc | 0 | WS | BK | 1.0.0 | FF | — |  |  | |
U+000D | <control-000D> | Возврат каретки | Cc | 0 | B | CR | 1.0.0 | CR | — | 
 | | |
U+000E | <control-000E> | Режим национальных символов | Cc | 0 | BN | CM | 1.0.0 | SO | — |  |  | |
U+000F | <control-000F> | Режим обычного ASCII | Cc | 0 | BN | CM | 1.0.0 | SI | — |  |  | |
U+0010 | <control-0010> | Освобождение канала данных | Cc | 0 | BN | CM | 1.0.0 | DLE | — |  |  | |
U+0011 | <control-0011> | Первый код управления устройством | Cc | 0 | BN | CM | 1.0.0 | DC1 | — |  |  | |
U+0012 | <control-0012> | Второй код управления устройством | Cc | 0 | BN | CM | 1.0.0 | DC2 | — |  |  | |
U+0013 | <control-0013> | Третий код управления устройством | Cc | 0 | BN | CM | 1.0.0 | DC3 | — |  |  | |
U+0014 | <control-0014> | Четвёртый код управления устройством | Cc | 0 | BN | CM | 1.0.0 | DC4 | — |  |  | |
U+0015 | <control-0015> | Отрицательное подтверждение | Cc | 0 | BN | CM | 1.0.0 | NAK | — |  |  | |
U+0016 | <control-0016> | Пустой символ для синхронного режима передачи | Cc | 0 | BN | CM | 1.0.0 | SYN | — |  |  | |
U+0017 | <control-0017> | Конец блока передаваемых данных | Cc | 0 | BN | CM | 1.0.0 | ETB | — |  |  | |
U+0018 | <control-0018> | Отмена | Cc | 0 | BN | CM | 1.0.0 | CAN | — |  |  | |
U+0019 | <control-0019> | Конец носителя | Cc | 0 | BN | CM | 1.0.0 | EM | — |  |  | |
U+001A | <control-001A> | Символ замены | Cc | 0 | BN | CM | 1.0.0 | SUB | — |  |  | |
U+001B | <control-001B> | Управляющая последовательность | Cc | 0 | BN | CM | 1.0.0 | ESC | — |  |  | |
U+001C | <control-001C> | Разделитель данных № 4 (разделитель файлов) | Cc | 0 | B | CM | 1.0.0 | FS | — |  |  | |
U+001D | <control-001D> | Разделитель данных № 3 (разделитель групп) | Cc | 0 | B | CM | 1.0.0 | GS | — |  |  | |
U+001E | <control-001E> | Разделитель данных № 2 (разделитель записей) | Cc | 0 | B | CM | 1.0.0 | RS | — |  |  | |
U+001F | <control-001F> | Разделитель данных № 1 (разделитель полей) | Cc | 0 | S | CM | 1.0.0 | US | — |  |  | |
Пунктуация и другие символы ASCII | ||||||||||||
U+0020 | space | Пробел | Zs | 0 | WS | SP | 1.0.0 | SP | — |   |   | |
U+0021 | ! | exclamation mark | Восклицательный знак | Po | 0 | ON | EX | 1.0.0 | — | ! | ! | ! |
U+0022 | " | quotation mark | Кавычка | Po | 0 | ON | QU | 1.0.0 | — | " " |
" | " |
U+0023 | # | number sign | Знак решётки | Po | 0 | ET | AL | 1.0.0 | — | # | # | # |
U+0024 | $ | dollar sign | Символ доллара | Sc | 0 | ET | PR | 1.0.0 | — | $ | $ | $ |
U+0025 | % | percent sign | Знак процента | Po | 0 | ET | PO | 1.0.0 | — | % | % | % |
U+0026 | & | ampersand | Амперсанд | Po | 0 | ON | AL | 1.0.0 | — | & & |
& | & |
U+0027 | ' | apostrophe | Машинописный апостроф | Po | 0 | ON | QU | 1.0.0 | — | ' | ' | ' |
U+0028 | ( | left parenthesis | Левая скобка | Ps | 0 | ON | OP | 1.0.0 | — | ( | ( | ( |
U+0029 | ) | right parenthesis | Правая скобка | Pe | 0 | ON | CP | 1.0.0 | — | ) | ) | ) |
U+002A | * | asterisk | Звёздочка | Po | 0 | ON | AL | 1.0.0 | — | * * |
* | * |
U+002B | + | plus sign | Знак плюса | Sm | 0 | ES | PR | 1.0.0 | — | + | + | + |
U+002C | , | comma | Запятая | Po | 0 | CS | IS | 1.0.0 | — | , | , | , |
U+002D | - | hyphen-minus | Дефис | Pd | 0 | ES | HY | 1.0.0 | — | — | - | - |
U+002E | . | full stop | Точка | Po | 0 | CS | IS | 1.0.0 | — | . | . | . |
U+002F | / | solidus | Косая черта | Po | 0 | CS | SY | 1.0.0 | — | / | / | / |
Цифры ASCII | ||||||||||||
U+0030 | 0 | digit zero | Цифра ноль | Nd | 0 | EN | NU | 1.0.0 | — | — | 0 | 0 |
U+0031 | 1 | digit one | Цифра один | Nd | 0 | EN | NU | 1.0.0 | — | — | 1 | 1 |
U+0032 | 2 | digit two | Цифра два | Nd | 0 | EN | NU | 1.0.0 | — | — | 2 | 2 |
U+0033 | 3 | digit three | Цифра три | Nd | 0 | EN | NU | 1.0.0 | — | — | 3 | 3 |
U+0034 | 4 | digit four | Цифра четыре | Nd | 0 | EN | NU | 1.0.0 | — | — | 4 | 4 |
U+0035 | 5 | digit five | Цифра пять | Nd | 0 | EN | NU | 1.0.0 | — | — | 5 | 5 |
U+0036 | 6 | digit six | Цифра шесть | Nd | 0 | EN | NU | 1.0.0 | — | — | 6 | 6 |
U+0037 | 7 | digit seven | Цифра семь | Nd | 0 | EN | NU | 1.0.0 | — | — | 7 | 7 |
U+0038 | 8 | digit eight | Цифра восемь | Nd | 0 | EN | NU | 1.0.0 | — | — | 8 | 8 |
U+0039 | 9 | digit nine | Цифра девять | Nd | 0 | EN | NU | 1.0.0 | — | — | 9 | 9 |
Пунктуация и другие символы ASCII | ||||||||||||
U+003A | : | colon | Двоеточие | Po | 0 | CS | IS | 1.0.0 | — | : | : | : |
U+003B | ; | semicolon | Точка с запятой | Po | 0 | ON | IS | 1.0.0 | — | ; | ; | ; |
U+003C | < | less-than sign | Знак «меньше» | Sm | 0 | ON | AL | 1.0.0 | — | < < |
< | < |
U+003D | = | equals sign | Знак равенства | Sm | 0 | ON | AL | 1.0.0 | — | = | = | = |
U+003E | > | greater-than sign | Знак «больше» | Sm | 0 | ON | AL | 1.0.0 | — | > > |
> | > |
U+003F | ? | question mark | Вопросительный знак | Po | 0 | ON | EX | 1.0.0 | — | ? | ? | ? |
U+0040 | @ | commercial at | Знак «at» | Po | 0 | ON | AL | 1.0.0 | — | @ | @ | @ |
Заглавные буквы латинского алфавита | ||||||||||||
U+0041 | A | latin capital letter a | Латинская заглавная буква A | Lu | 0 | L | AL | 1.0.0 | — | — | A | A |
U+0042 | B | latin capital letter b | Латинская заглавная буква B | Lu | 0 | L | AL | 1.0.0 | — | — | B | B |
U+0043 | C | latin capital letter c | Латинская заглавная буква C | Lu | 0 | L | AL | 1.0.0 | — | — | C | C |
U+0044 | D | latin capital letter d | Латинская заглавная буква D | Lu | 0 | L | AL | 1.0.0 | — | — | D | D |
U+0045 | E | latin capital letter e | Латинская заглавная буква E | Lu | 0 | L | AL | 1.0.0 | — | — | E | E |
U+0046 | F | latin capital letter f | Латинская заглавная буква F | Lu | 0 | L | AL | 1.0.0 | — | — | F | F |
U+0047 | G | latin capital letter g | Латинская заглавная буква G | Lu | 0 | L | AL | 1.0.0 | — | — | G | G |
U+0048 | H | latin capital letter h | Латинская заглавная буква H | Lu | 0 | L | AL | 1.0.0 | — | — | H | H |
U+0049 | I | latin capital letter i | Латинская заглавная буква I | Lu | 0 | L | AL | 1.0.0 | — | — | I | I |
U+004A | J | latin capital letter j | Латинская заглавная буква J | Lu | 0 | L | AL | 1.0.0 | — | — | J | J |
U+004B | K | latin capital letter k | Латинская заглавная буква K | Lu | 0 | L | AL | 1.0.0 | — | — | K | K |
U+004C | L | latin capital letter l | Латинская заглавная буква L | Lu | 0 | L | AL | 1.0.0 | — | — | L | L |
U+004D | M | latin capital letter m | Латинская заглавная буква M | Lu | 0 | L | AL | 1.0.0 | — | — | M | M |
U+004E | N | latin capital letter n | Латинская заглавная буква N | Lu | 0 | L | AL | 1.0.0 | — | — | N | N |
U+004F | O | latin capital letter o | Латинская заглавная буква O | Lu | 0 | L | AL | 1.0.0 | — | — | O | O |
U+0050 | P | latin capital letter p | Латинская заглавная буква P | Lu | 0 | L | AL | 1.0.0 | — | — | P | P |
U+0051 | Q | latin capital letter q | Латинская заглавная буква Q | Lu | 0 | L | AL | 1.0.0 | — | — | Q | Q |
U+0052 | R | latin capital letter r | Латинская заглавная буква R | Lu | 0 | L | AL | 1.0.0 | — | — | R | R |
U+0053 | S | latin capital letter s | Латинская заглавная буква S | Lu | 0 | L | AL | 1.0.0 | — | — | S | S |
U+0054 | T | latin capital letter t | Латинская заглавная буква T | Lu | 0 | L | AL | 1.0.0 | — | — | T | T |
U+0055 | U | latin capital letter u | Латинская заглавная буква U | Lu | 0 | L | AL | 1.0.0 | — | — | U | U |
U+0056 | V | latin capital letter v | Латинская заглавная буква V | Lu | 0 | L | AL | 1.0.0 | — | — | V | V |
U+0057 | W | latin capital letter w | Латинская заглавная буква W | Lu | 0 | L | AL | 1.0.0 | — | — | W | W |
U+0058 | X | latin capital letter x | Латинская заглавная буква X | Lu | 0 | L | AL | 1.0.0 | — | — | X | X |
U+0059 | Y | latin capital letter y | Латинская заглавная буква Y | Lu | 0 | L | AL | 1.0.0 | — | — | Y | Y |
U+005A | Z | latin capital letter z | Латинская заглавная буква Z | Lu | 0 | L | AL | 1.0.0 | — | — | Z | Z |
Пунктуация и другие символы ASCII | ||||||||||||
U+005B | [ | left square bracket | Левая квадратная скобка | Ps | 0 | ON | OP | 1.0.0 | — | [ [ |
[ | [ |
U+005C | \ | reverse solidus | Обратная косая черта[A] | Po | 0 | ON | PR | 1.0.0 | — | \ | \ | \ |
U+005D | ] | right square bracket | Правая квадратная скобка | Pe | 0 | ON | CP | 1.0.0 | — | ] ] |
] | ] |
U+005E | ^ | circumflex accent | Карет | Sk | 0 | ON | AL | 1.0.0 | — | ^ | ^ | ^ |
U+005F | _ | low line | Подчёркивание | Pc | 0 | ON | AL | 1.0.0 | — | _ _ |
_ | _ |
U+0060 | ` | grave accent | Машинописный обратный апостроф | Sk | 0 | ON | AL | 1.0.0 | — | ` ` |
` | ` |
Строчные буквы латинского алфавита | ||||||||||||
U+0061 | a | latin small letter a | Латинская строчная буква A | Ll | 0 | L | AL | 1.0.0 | — | — | a | a |
U+0062 | b | latin small letter b | Латинская строчная буква B | Ll | 0 | L | AL | 1.0.0 | — | — | b | b |
U+0063 | c | latin small letter c | Латинская строчная буква C | Ll | 0 | L | AL | 1.0.0 | — | — | c | c |
U+0064 | d | latin small letter d | Латинская строчная буква D | Ll | 0 | L | AL | 1.0.0 | — | — | d | d |
U+0065 | e | latin small letter e | Латинская строчная буква E | Ll | 0 | L | AL | 1.0.0 | — | — | e | e |
U+0066 | f | latin small letter f | Латинская строчная буква F | Ll | 0 | L | AL | 1.0.0 | — | — | f | f |
U+0067 | g | latin small letter g | Латинская строчная буква G | Ll | 0 | L | AL | 1.0.0 | — | — | g | g |
U+0068 | h | latin small letter h | Латинская строчная буква H | Ll | 0 | L | AL | 1.0.0 | — | — | h | h |
U+0069 | i | latin small letter i | Латинская строчная буква I | Ll | 0 | L | AL | 1.0.0 | — | — | i | i |
U+006A | j | latin small letter j | Латинская строчная буква J | Ll | 0 | L | AL | 1.0.0 | — | — | j | j |
U+006B | k | latin small letter k | Латинская строчная буква K | Ll | 0 | L | AL | 1.0.0 | — | — | k | k |
U+006C | l | latin small letter l | Латинская строчная буква L | Ll | 0 | L | AL | 1.0.0 | — | — | l | l |
U+006D | m | latin small letter m | Латинская строчная буква M | Ll | 0 | L | AL | 1.0.0 | — | — | m | m |
U+006E | n | latin small letter n | Латинская строчная буква N | Ll | 0 | L | AL | 1.0.0 | — | — | n | n |
U+006F | o | latin small letter o | Латинская строчная буква O | Ll | 0 | L | AL | 1.0.0 | — | — | o | o |
U+0070 | p | latin small letter p | Латинская строчная буква P | Ll | 0 | L | AL | 1.0.0 | — | — | p | p |
U+0071 | q | latin small letter q | Латинская строчная буква Q | Ll | 0 | L | AL | 1.0.0 | — | — | q | q |
U+0072 | r | latin small letter r | Латинская строчная буква R | Ll | 0 | L | AL | 1.0.0 | — | — | r | r |
U+0073 | s | latin small letter s | Латинская строчная буква S | Ll | 0 | L | AL | 1.0.0 | — | — | s | s |
U+0074 | t | latin small letter t | Латинская строчная буква T | Ll | 0 | L | AL | 1.0.0 | — | — | t | t |
U+0075 | u | latin small letter u | Латинская строчная буква U | Ll | 0 | L | AL | 1.0.0 | — | — | u | u |
U+0076 | v | latin small letter v | Латинская строчная буква V | Ll | 0 | L | AL | 1.0.0 | — | — | v | v |
U+0077 | w | latin small letter w | Латинская строчная буква W | Ll | 0 | L | AL | 1.0.0 | — | — | w | w |
U+0078 | x | latin small letter x | Латинская строчная буква X | Ll | 0 | L | AL | 1.0.0 | — | — | x | x |
U+0079 | y | latin small letter y | Латинская строчная буква Y | Ll | 0 | L | AL | 1.0.0 | — | — | y | y |
U+007A | z | latin small letter z | Латинская строчная буква Z | Ll | 0 | L | AL | 1.0.0 | — | — | z | z |
Пунктуация и другие символы ASCII | ||||||||||||
U+007B | { | left curly bracket | Левая фигурная скобка | Ps | 0 | ON | OP | 1.0.0 | — | { { |
{ | { |
U+007C | | | vertical line | Вертикальная черта | Sm | 0 | ON | BA | 1.0.0 | — | | | | |
| | | |
U+007D | } | right curly bracket | Правая фигурная скобка | Pe | 0 | ON | CL | 1.0.0 | — | } } |
} | } |
U+007E | ~ | tilde | Тильда | Sm | 0 | ON | AL | 1.0.0 | — | — | ~ | ~ |
Управляющий символ | ||||||||||||
U+007F | <control-007F> | Удаление | Cc | 0 | BN | CM | 1.0.0 | DEL | — |  |  |
- A Символ U+005C (\) может отображаться как символ иены или воны в японских и корейских ошибочных шрифтах с поддержкой Юникода в устаревшем наборе символов, в котором косая черта заменена этими знаками[4].
ПодблокиПравить
Блок Юникода «Управляющие символы C0 и базовая латиница» содержит шесть подблоков[5].
Управляющие символы C0Править
Управляющие символы C0, называемые «Управляющими кодами C0 ASCII» унаследованы от ASCII и других 7- и 8-битных систем кодирования. Названия управляющих символов взяты из стандарта ISO/IEC 6429:1992[5].
Пунктуация и другие символы ASCIIПравить
Этот подблок включает стандартные знаки препинания, простые математические операторы и символы, такие как знак доллара, процента, амперсанд, подчёркивание и вертикальную черту[5].
Цифры ASCIIПравить
Этот подблок содержит стандартные европейские цифры от 1 до 9 и 0[5].
Заглавные буквы латинского алфавитаПравить
Содержит маюскулы стандартного 26-буквенного латинского алфавита[5].
Строчные буквы латинского алфавитаПравить
Содержит минускулы стандартного 26-буквенного латинского алфавита[5].
Управляющий символПравить
Содержит управляющий символ «Удаление»[5].
Компактная таблицаПравить
Управляющие символы C0 и основная латиница[1] Официальная таблица символов Консорциума Юникода Архивная копия от 26 мая 2016 на Wayback Machine (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+000x | NUL
|
SOH
|
STX
|
ETX
|
EOT
|
ENQ
|
ACK
|
BEL
|
BS
|
HT
|
LF
|
VT
|
FF
|
CR
|
SO
|
SI
|
U+001x | DLE
|
DC1
|
DC2
|
DC3
|
DC4
|
NAK
|
SYN
|
ETB
|
CAN
|
EM
|
SUB
|
ESC
|
FS
|
GS
|
RS
|
US
|
U+002x | SP
|
! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
U+003x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
U+004x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
U+005x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
U+006x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
U+007x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | DEL
|
Примечания
|
Графическая таблицаПравить
См. такжеПравить
ПримечанияПравить
- ↑ Unicode character database (неопр.). The Unicode Standard. Дата обращения: 30 января 2017. Архивировано 25 декабря 2018 года.
- ↑ Enumerated Versions of The Unicode Standard (неопр.). The Unicode Standard. Дата обращения: 30 января 2017. Архивировано 25 декабря 2018 года.
- ↑ The Unicode Standard Version 1.0, Volume 1. — Addison-Wesley Publishing Company, Inc., 1990. — ISBN 0-201-56788-1.
- ↑ Sorting it all Out : When is a backslash not a backslash? (неопр.) Дата обращения: 9 апреля 2016. Архивировано 23 марта 2016 года.
- ↑ 1 2 3 4 5 6 7 Unicode 6.2 code charts (неопр.). The Unicode Standard. Архивировано 1 августа 2015 года.