ISO 8859-1
ISO/IEC 8859-1 (также известная как ISO 8859-1 и Latin-1) — кодовая страница, предназначенная для западноевропейских языков; она базируется на символьном наборе популярных в прошлом терминалов VT220. Кодовые позиции 0—31 (0x0—0x1F) и 127—159 (0x7F—0x9F) не определены. По образцу ISO 8859-1 сделаны все остальные кодировки серии ISO 8859.
ISO-8859-1 — кодировка, зарегистрированная IANA в 1992 г. В отличие от ISO/IEC 8859-1, кодовые позиции 0—31 и 127—159 здесь заполнены управляющими символами (большинство из которых используется весьма редко). В HTML ISO-8859-1 является кодировкой по умолчанию (в XHTML, однако, кодировкой по умолчанию является UTF-8).
IANA разрешает использовать следующие варианты названия: ISO_8859-1:1987, ISO_8859-1, ISO-8859-1, iso-ir-100, sISOLatin1, latin1, l1, IBM819, CP819.
В Юникоде первые 256 кодовых позиций совпадают с ISO-8859-1.
В Microsoft Windows для западноевропейских языков используется кодировка Windows-1252, которая отличается от ISO-8859-1 тем, что позиции 128—159 (0x80—0x9F) здесь заняты разными полезными типографскими символами. Большинство браузеров не различает ISO-8859-1 и Windows-1252 — фактически, и в том, и в другом случае они отображают текст как Windows-1252.
Такая путаница между этими двумя кодировками привела к тому, что многие программы, генерирующие файлы HTML, ошибочно обозначали символы их кодами из Windows−1252 вместо кодов Юникода (исходя из того, что номер символа в ISO-8859-1 равен его номеру в Юникоде): например, тире (—) обозначалось —
вместо правильного —
, многоточие обозначалось …
вместо правильного …
и т. д.; из-за распространённости этого явления современные браузеры продолжают показывать, например, —
как тире, хотя на самом деле —
— это управляющий символ «end of guarded area», применение которого в HTML бессмысленно.
В проекте стандарта HTML 5 предписывается показывать ISO-8859-1 как Windows-1252.[1]
ТаблицыПравить
Нижняя часть (0—127) таблиц кодировки не показана, поскольку полностью соответствует обычному ASCII. Числа под буквами обозначают шестнадцатеричный код буквы в Юникоде.
ISO-8859-1Править
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. |
PAD 80 |
HOP 81 |
BPH 82 |
NBH 83 |
IND 84 |
NEL 85 |
SSA 86 |
ESA 87 |
HTS 88 |
HTJ 89 |
VTS 8A |
PLD 8B |
PLU 8C |
RI 8D |
SS2 8E |
SS3 8F |
9. |
DCS 90 |
PU1 91 |
PU2 92 |
STS 93 |
CCH 94 |
MW 95 |
SPA 96 |
EPA 97 |
SOS 98 |
SGCI 99 |
SCI 9A |
CSI 9B |
ST 9C |
OSC 9D |
PM 9E |
APC 9F |
A. |
A0 |
¡ A1 |
¢ A2 |
£ A3 |
¤ A4 |
¥ A5 |
¦ A6 |
§ A7 |
¨ A8 |
© A9 |
ª AA |
« AB |
¬ AC |
AD |
® AE |
¯ AF |
B. |
° B0 |
± B1 |
² B2 |
³ B3 |
´ B4 |
µ B5 |
¶ B6 |
· B7 |
¸ B8 |
¹ B9 |
º BA |
» BB |
¼ BC |
½ BD |
¾ BE |
¿ BF |
C. |
À C0 |
Á C1 |
 C2 |
à C3 |
Ä C4 |
Å C5 |
Æ C6 |
Ç C7 |
È C8 |
É C9 |
Ê CA |
Ë CB |
Ì CC |
Í CD |
Î CE |
Ï CF |
D. |
Ð D0 |
Ñ D1 |
Ò D2 |
Ó D3 |
Ô D4 |
Õ D5 |
Ö D6 |
× D7 |
Ø D8 |
Ù D9 |
Ú DA |
Û DB |
Ü DC |
Ý DD |
Þ DE |
ß DF |
E. |
à E0 |
á E1 |
â E2 |
ã E3 |
ä E4 |
å E5 |
æ E6 |
ç E7 |
è E8 |
é E9 |
ê EA |
ë EB |
ì EC |
í ED |
î EE |
ï EF |
F. |
ð F0 |
ñ F1 |
ò F2 |
ó F3 |
ô F4 |
õ F5 |
ö F6 |
÷ F7 |
ø F8 |
ù F9 |
ú FA |
û FB |
ü FC |
ý FD |
þ FE |
ÿ FF |
Интересно расположение символов × и ÷ посреди букв: первоначально там планировалось разместить лигатуру Œœ, но в конечном итоге было решено, что она не нужна, и освободившиеся два места были заполнены небуквенными символами.[2]
Windows−1252Править
В первоначальной версии этой кодировки отсутствовали символы: € (0x80), ˆ (0x88), ˜ (0x98), Ž (0x8E), ž (0x9E).
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. |
€ 20AC |
‚ 201A |
ƒ 192 |
„ 201E |
… 2026 |
† 2020 |
‡ 2021 |
ˆ 2C6 |
‰ 2030 |
Š 160 |
‹ 2039 |
Œ 152 |
Ž 17D |
|||
9. |
‘ 2018 |
’ 2019 |
“ 201C |
” 201D |
• 2022 |
– 2013 |
— 2014 |
˜ 2DC |
™ 2122 |
š 161 |
› 203A |
œ 153 |
ž 17E |
Ÿ 178 | ||
A. |
A0 |
¡ A1 |
¢ A2 |
£ A3 |
¤ A4 |
¥ A5 |
¦ A6 |
§ A7 |
¨ A8 |
© A9 |
ª AA |
« AB |
¬ AC |
AD |
® AE |
¯ AF |
B. |
° B0 |
± B1 |
² B2 |
³ B3 |
´ B4 |
µ B5 |
¶ B6 |
· B7 |
¸ B8 |
¹ B9 |
º BA |
» BB |
¼ BC |
½ BD |
¾ BE |
¿ BF |
C. |
À C0 |
Á C1 |
 C2 |
à C3 |
Ä C4 |
Å C5 |
Æ C6 |
Ç C7 |
È C8 |
É C9 |
Ê CA |
Ë CB |
Ì CC |
Í CD |
Î CE |
Ï CF |
D. |
Ð D0 |
Ñ D1 |
Ò D2 |
Ó D3 |
Ô D4 |
Õ D5 |
Ö D6 |
× D7 |
Ø D8 |
Ù D9 |
Ú DA |
Û DB |
Ü DC |
Ý DD |
Þ DE |
ß DF |
E. |
à E0 |
á E1 |
â E2 |
ã E3 |
ä E4 |
å E5 |
æ E6 |
ç E7 |
è E8 |
é E9 |
ê EA |
ë EB |
ì EC |
í ED |
î EE |
ï EF |
F. |
ð F0 |
ñ F1 |
ò F2 |
ó F3 |
ô F4 |
õ F5 |
ö F6 |
÷ F7 |
ø F8 |
ù F9 |
ú FA |
û FB |
ü FC |
ý FD |
þ FE |
ÿ FF |
ПримечанияПравить
- ↑ Проект стандарта на сайте www.w3.org (неопр.). Дата обращения: 15 января 2010. Архивировано 6 января 2010 года.
- ↑ Disposition of comments on ballot results SC2 N 3005 — ISO/IEC 8859 Part 15 (неопр.). Дата обращения: 25 июня 2010. Архивировано 19 июня 2010 года.