2.5: Деталь - ASCII
- Page ID
- 29858
ASCII, що розшифровується як «Американський стандартний код обміну інформацією», був введений Американським національним інститутом стандартів (ANSI) в 1963 році. Це найбільш часто використовуваний символьний код.
ASCII - це семибітний код, що представляє 33 керуючі символи та 95 символів друку (включаючи пробіл) у таблиці 2.2. Керуючі символи використовуються для сигналізації особливих умов, як описано в таблиці 2.3.
| Керуючі персонажі | Цифри | Прописні | Малі регістри | ||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ШЕСТИГРАННИЙ | ГРУД | ЧР | Ctrl | ШЕСТИГРАННИЙ | ГРУД | ЧР | ШЕСТИГРАННИЙ | ГРУД | ЧР | ШЕСТИГРАННИЙ | ГРУД | ЧР | |||
| 00 | 0 | НУЛЬ | ^@ | 20 | 32 | СП | 40 | 64 | @ | 60 | 96 | ' | |||
| 01 | 1 | СОХ | ^A | 21 | 33 | ! | 41 | 65 | A | 61 | 97 | a | |||
| 02 | 2 | STX | ^B | 22 | 34 | « | 42 | 66 | Б | 62 | 98 | б | |||
| 03 | 3 | І Т.Д. | ^C | 23 | 35 | # | 43 | 67 | C | 63 | 99 | c | |||
| 04 | 4 | ЕОТ | ^D | 24 | 36 | $ | 44 | 68 | D | 64 | 100 | d | |||
| 05 | 5 | ЕНК | ^E | 25 | 37 | % | 45 | 69 | Е | 65 | 101 | е | |||
| 06 | 6 | НАЗАД | ^F | 26 | 38 | & | 46 | 70 | F | 66 | 102 | f | |||
| 07 | 7 | БЕЛ | ^Г | 27 | 39 | ' | 47 | 71 | Г | 67 | 103 | г | |||
| 08 | 8 | БС | ^H | 28 | 40 | ( | 48 | 72 | Ч | 68 | 104 | ч | |||
| 09 | 9 | ХТ | ^I | 29 | 41 | ) | 49 | 73 | Я | 69 | 105 | я | |||
| 0А | 10 | ЛФ | ^J | 2А | 42 | * | 4А | 74 | J | 6А | 106 | j | |||
| 0Б | 11 | VT | ^K | 2B | 43 | + | 4Б | 75 | К | 6Б | 107 | к | |||
| 0С | 12 | FF | ^Л | 2C | 44 | , | 4C | 76 | Л | 6C | 108 | л | |||
| 0D | 13 | КР | ^М | 2D | 45 | - | 4D | 77 | М | 6D | 109 | м | |||
| 0Е | 14 | ТОМУ | ^N | 2Е | 46 | . | 4Е | 78 | П | 6Е | 110 | п | |||
| 0Ф | 15 | СІ | ^O | 2F | 47 | / | 4Ф | 79 | O | 6F | 111 | o | |||
| 10 | 16 | DLE | ^P | 30 | 48 | 0 | 50 | 80 | Р | 70 | 112 | р | |||
| 11 | 17 | DC1 | ^Q | 31 | 49 | 1 | 51 | 81 | Q | 71 | 113 | q | |||
| 12 | 18 | DC2 | ^R | 32 | 50 | 2 | 52 | 82 | Р | 72 | 114 | р | |||
| 13 | 19 | DC3 | ^S | 33 | 51 | 3 | 53 | 83 | S | 73 | 115 | s | |||
| 14 | 20 | ДК 4 | ^T | 34 | 52 | 4 | 54 | 84 | Т | 74 | 116 | т | |||
| 15 | 21 | НАК | ^U | 35 | 53 | 5 | 55 | 85 | У | 75 | 117 | у | |||
| 16 | 22 | СИН | ^V | 36 | 54 | 6 | 56 | 86 | V | 76 | 118 | v | |||
| 17 | 23 | ETB | ^W | 37 | 55 | 7 | 57 | 87 | Ш | 77 | 119 | ш | |||
| 18 | 24 | МОЖЕ | ^X | 38 | 56 | 8 | 58 | 88 | Х | 78 | 120 | х | |||
| 19 | 25 | ЕМ | ^Y | 39 | 57 | 9 | 59 | 89 | У | 79 | 121 | у | |||
| 1А | 26 | СУБ | ^Z | 3А | 58 | : | 5А | 90 | Z | 7А | 122 | z | |||
| 1Б | 27 | ЕСК | ^ [ | 3Б | 59 | ; | 5Б | 91 | [ | 7Б | 123 | { | |||
| 1С | 28 | ФС | ^\ | 3C | 60 | ¡ | 5C | 92 | \ | 7C | 124 | — | |||
| 1D | 29 | GS | ^] | 3D | 61 | = | 5D | 93 | ] | 7D | 125 | } | |||
| 1Е | 30 | RS | ^^ | 3Е | 62 | > | 5Е | 94 | ^ | 7Е | 126 | ~ | |||
| 1Ф | 31 | НАМ | ^_ | 3F | 63 | ? | 5F | 95 | _ | 7F | 127 | ДЕЛЬ | |||
Увімкнено до 8 біт
У 8-бітовому контексті символи ASCII слідують за провідним 0, і, таким чином, можуть розглядатися як «нижня половина» більшого коду. 128 символів, представлених кодами між HEX 80 і HEX FF (іноді неправильно називають «високий ASCII» або «розширений ASCII») були визначені по-різному в різних контекстах. На багатьох операційних системах вони включали акцентовані західноєвропейські літери і різні додаткові
| ШЕСТИГРАННИЙ | ГРУД | ЧР | Ctrl | Значення |
|---|---|---|---|---|
| 00 | 0 | НУЛЬ | ^@ | Null порожній лідер на паперовій стрічці; як правило, |
| 01 | 1 | СОХ | ^A | Початок заголовка |
| 02 | 2 | STX | ^B | Початок тексту |
| 03 | 3 | І Т.Д. | ^C | Кінець тексту; відповідає STX |
| 04 | 4 | ЕОТ | ^D | Кінець передачі |
| 05 | 5 | ЕНК | ^E | Запит |
| 06 | 6 | НАЗАД | ^F | Підтвердити; позитивна відповідь на ENQ |
| 07 | 7 | БЕЛ | ^Г | BELL; звуковий сигнал, дзвінок на ранніх автоматах |
| 08 | 8 | БС | ^H | BackSpace; неруйнівний, ігнорується на лівому полі |
| 09 | 9 | ХТ | ^I | Горизонтальна вкладка |
| 0А | 10 | ЛФ | ^J | Лінійна подача; папір вгору або друкуюча головка вниз; новий рядок на Unix |
| 0Б | 11 | VT | ^K | Вертикальна вкладка |
| 0С | 12 | FF | ^Л | Форма подачі; почати нову сторінку |
| 0D | 13 | КР | ^М | Повернення каретки; друкувальна головка до лівого поля; новий рядок на Mac |
| 0Е | 14 | ТОМУ | ^N | Shift Out; почати використання альтернативного набору символів |
| 0Ф | 15 | СІ | ^O | Shift In; відновити використання набору символів за замовчуванням |
| 10 | 16 | DLE | ^P | Data Link Escape; змінює значення наступного символу |
| 11 | 17 | DC1 | ^Q | Управління пристроєм 1; якщо використовується управління потоком, XON, OK для відправки |
| 12 | 18 | DC2 | ^R | Управління пристроєм 2 |
| 13 | 19 | DC3 | ^S | Управління пристроєм 3; якщо використовується управління потоком, XOFF, припинити надсилання |
| 14 | 20 | ДК 4 | ^T | Управління пристроєм 4 |
| 15 | 21 | НАК | ^U | Негативний ConceRize; відповідь на ENQ |
| 16 | 22 | СИН | ^V | Синхронний холостий |
| 17 | 23 | ETB | ^W | Кінець блоку передач |
| 18 | 24 | МОЖЕ | ^X | Cancel; ігнорувати попередній блок |
| 19 | 25 | ЕМ | ^Y | Кінець середнього |
| 1А | 26 | СУБ | ^Z | Замінюємо |
| 1Б | 27 | ЕСК | ^ [ | ESCAPE; змінює значення наступного символу |
| 1С | 28 | ФС | ^\ | Розділювач файлів; найбільший масштаб |
| 1D | 29 | GS | ^] | Груповий сепаратор; груба шкала |
| 1Е | 30 | RS | ^^ | Розділювач записів; дрібний масштаб |
| 1Ф | 31 | НАМ | ^_ | Роздільник одиниць; найтонший масштаб |
| 20 | 32 | СП | SPACE; зазвичай не вважається керуючим персонажем | |
| 7F | 127 | ДЕЛЬ | Delete; спочатку ігнорується; іноді руйнівний backspace |
розділові знаки. На ПК IBM вони включали символи лінійного малювання. Маки використовували (і досі використовують) інше кодування.
На щастя, люди зараз цінують необхідність сумісності комп'ютерних платформ, тому на користь йдуть більш універсальні стандарти. Найпоширенішим кодом, який використовується для веб-сторінок, є ISO-8859-1 (ISO-латиниця), який використовує 96 кодів між HEX A0 та HEX FF для різних акцентованих букв та розділових знаків західноєвропейських мов та кількох інших символів. 32 символи між HEX 80 і HEX 9F зарезервовані як керуючі символи в ISO-8859-1.
Природа терпляє вакуум. Більшість людей не хочуть 32 більше контрольних символів (дійсно, з 33 керуючих символів в 7-бітному ASCII, тільки близько десяти регулярно використовуються в тексті). Отже, не було кінця ідей щодо використання HEX 80 до HEX 9F. Найбільш широко використовуваною конвенцією є Microsoft Windows Code Page 1252 (латиниця I), яка така ж, як ISO-8859-1 (ISO-латиниця), за винятком того, що 27 з 32 контрольних кодів присвоюються друкованим символам, один з яких HEX 80, символ валюти євро. Не всі платформи і операційні системи розпізнають CP-1252, тому документи, і зокрема веб-сторінки, вимагають особливої уваги.
Поза 8 біт
Для представлення азіатських мов потрібно набагато більше символів. В даний час ведеться активна розробка відповідних стандартів, і, як правило, вважається, що загальна кількість символів, які потрібно представити, менше 65 536. Це пощастило, тому що багато різних символів можуть бути представлені в 16 бітах, або 2 байтах. Для того, щоб залишатися в межах цього числа, письмові версії деяких китайських діалектів повинні ділитися символами, які виглядають однаково.
Найсильніший кандидат на 2-байтовий стандартний код символів сьогодні відомий як Unicode.
Довідка
Існує багато веб-сторінок, які дають діаграму ASCII, з розширеннями для всіх мов світу. Серед більш корисних:
- Джим Прайс, з ПК та Windows 8-бітними діаграмами та кількома додатковими посиланнями http://www.jimprice.com/jim-asc.shtml
- Коротка історія кодів символів, з обговоренням розширення азіатських мов http://tronweb.super-nova.co.jp/characcodehist.html
- Домашня сторінка Юнікоду http://www.unicode.org/
- Стандарт Windows CP-1252, остаточний www.microsoft.com/globaldev/r... /sbcs/1252.htm
- CP-1252 порівняно з:
- Юнікод http://ftp.unicode.org/Public/MAPPIN...OWS/CP1252.TXT
- Юнікод/HTML http://www.alanwood.net/demos/ansi.html
- ІСО-8859-1/Mac OS http://www.jwz.org/doc/charsets.html
