Skip to main content
LibreTexts - Ukrayinska

2.5: Деталь - ASCII

  • Page ID
    29858
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ASCII, що розшифровується як «Американський стандартний код обміну інформацією», був введений Американським національним інститутом стандартів (ANSI) в 1963 році. Це найбільш часто використовуваний символьний код.

    ASCII - це семибітний код, що представляє 33 керуючі символи та 95 символів друку (включаючи пробіл) у таблиці 2.2. Керуючі символи використовуються для сигналізації особливих умов, як описано в таблиці 2.3.

    Керуючі персонажі Цифри Прописні Малі регістри
    ШЕСТИГРАННИЙ ГРУД ЧР Ctrl ШЕСТИГРАННИЙ ГРУД ЧР ШЕСТИГРАННИЙ ГРУД ЧР ШЕСТИГРАННИЙ ГРУД ЧР
    00 0 НУЛЬ ^@ 20 32 СП 40 64 @ 60 96 '
    01 1 СОХ ^A 21 33 ! 41 65 A 61 97 a
    02 2 STX ^B 22 34 « 42 66 Б 62 98 б
    03 3 І Т.Д. ^C 23 35 # 43 67 C 63 99 c
    04 4 ЕОТ ^D 24 36 $ 44 68 D 64 100 d
    05 5 ЕНК ^E 25 37 % 45 69 Е 65 101 е
    06 6 НАЗАД ^F 26 38 & 46 70 F 66 102 f
    07 7 БЕЛ 27 39 ' 47 71 Г 67 103 г
    08 8 БС ^H 28 40 ( 48 72 Ч 68 104 ч
    09 9 ХТ ^I 29 41 ) 49 73 Я 69 105 я
    10 ЛФ ^J 42 * 74 J 106 j
    11 VT ^K 2B 43 + 75 К 107 к
    12 FF 2C 44 , 4C 76 Л 6C 108 л
    0D 13 КР 2D 45 - 4D 77 М 6D 109 м
    14 ТОМУ ^N 46 . 78 П 110 п
    15 СІ ^O 2F 47 / 79 O 6F 111 o
    10 16 DLE ^P 30 48 0 50 80 Р 70 112 р
    11 17 DC1 ^Q 31 49 1 51 81 Q 71 113 q
    12 18 DC2 ^R 32 50 2 52 82 Р 72 114 р
    13 19 DC3 ^S 33 51 3 53 83 S 73 115 s
    14 20 ДК 4 ^T 34 52 4 54 84 Т 74 116 т
    15 21 НАК ^U 35 53 5 55 85 У 75 117 у
    16 22 СИН ^V 36 54 6 56 86 V 76 118 v
    17 23 ETB ^W 37 55 7 57 87 Ш 77 119 ш
    18 24 МОЖЕ ^X 38 56 8 58 88 Х 78 120 х
    19 25 ЕМ ^Y 39 57 9 59 89 У 79 121 у
    26 СУБ ^Z 58 : 90 Z 122 z
    27 ЕСК ^ [ 59 ; 91 [ 123 {
    28 ФС ^\ 3C 60 ¡ 5C 92 \ 7C 124
    1D 29 GS ^] 3D 61 = 5D 93 ] 7D 125 }
    30 RS ^^ 62 > 94 ^ 126 ~
    31 НАМ ^_ 3F 63 ? 5F 95 _ 7F 127 ДЕЛЬ
    Таблиця 2.2: Набір символів ASCII

    Увімкнено до 8 біт

    У 8-бітовому контексті символи ASCII слідують за провідним 0, і, таким чином, можуть розглядатися як «нижня половина» більшого коду. 128 символів, представлених кодами між HEX 80 і HEX FF (іноді неправильно називають «високий ASCII» або «розширений ASCII») були визначені по-різному в різних контекстах. На багатьох операційних системах вони включали акцентовані західноєвропейські літери і різні додаткові

    ШЕСТИГРАННИЙ ГРУД ЧР Ctrl Значення
    00 0 НУЛЬ ^@ Null порожній лідер на паперовій стрічці; як правило,
    01 1 СОХ ^A Початок заголовка
    02 2 STX ^B Початок тексту
    03 3 І Т.Д. ^C Кінець тексту; відповідає STX
    04 4 ЕОТ ^D Кінець передачі
    05 5 ЕНК ^E Запит
    06 6 НАЗАД ^F Підтвердити; позитивна відповідь на ENQ
    07 7 БЕЛ BELL; звуковий сигнал, дзвінок на ранніх автоматах
    08 8 БС ^H BackSpace; неруйнівний, ігнорується на лівому полі
    09 9 ХТ ^I Горизонтальна вкладка
    10 ЛФ ^J Лінійна подача; папір вгору або друкуюча головка вниз; новий рядок на Unix
    11 VT ^K Вертикальна вкладка
    12 FF Форма подачі; почати нову сторінку
    0D 13 КР Повернення каретки; друкувальна головка до лівого поля; новий рядок на Mac
    14 ТОМУ ^N Shift Out; почати використання альтернативного набору символів
    15 СІ ^O Shift In; відновити використання набору символів за замовчуванням
    10 16 DLE ^P Data Link Escape; змінює значення наступного символу
    11 17 DC1 ^Q Управління пристроєм 1; якщо використовується управління потоком, XON, OK для відправки
    12 18 DC2 ^R Управління пристроєм 2
    13 19 DC3 ^S Управління пристроєм 3; якщо використовується управління потоком, XOFF, припинити надсилання
    14 20 ДК 4 ^T Управління пристроєм 4
    15 21 НАК ^U Негативний ConceRize; відповідь на ENQ
    16 22 СИН ^V Синхронний холостий
    17 23 ETB ^W Кінець блоку передач
    18 24 МОЖЕ ^X Cancel; ігнорувати попередній блок
    19 25 ЕМ ^Y Кінець середнього
    26 СУБ ^Z Замінюємо
    27 ЕСК ^ [ ESCAPE; змінює значення наступного символу
    28 ФС ^\ Розділювач файлів; найбільший масштаб
    1D 29 GS ^] Груповий сепаратор; груба шкала
    30 RS ^^ Розділювач записів; дрібний масштаб
    31 НАМ ^_ Роздільник одиниць; найтонший масштаб
    20 32 СП   SPACE; зазвичай не вважається керуючим персонажем
    7F 127 ДЕЛЬ   Delete; спочатку ігнорується; іноді руйнівний backspace
    Таблиця 2.3: Контрольні символи ASCII

    розділові знаки. На ПК IBM вони включали символи лінійного малювання. Маки використовували (і досі використовують) інше кодування.

    На щастя, люди зараз цінують необхідність сумісності комп'ютерних платформ, тому на користь йдуть більш універсальні стандарти. Найпоширенішим кодом, який використовується для веб-сторінок, є ISO-8859-1 (ISO-латиниця), який використовує 96 кодів між HEX A0 та HEX FF для різних акцентованих букв та розділових знаків західноєвропейських мов та кількох інших символів. 32 символи між HEX 80 і HEX 9F зарезервовані як керуючі символи в ISO-8859-1.

    Природа терпляє вакуум. Більшість людей не хочуть 32 більше контрольних символів (дійсно, з 33 керуючих символів в 7-бітному ASCII, тільки близько десяти регулярно використовуються в тексті). Отже, не було кінця ідей щодо використання HEX 80 до HEX 9F. Найбільш широко використовуваною конвенцією є Microsoft Windows Code Page 1252 (латиниця I), яка така ж, як ISO-8859-1 (ISO-латиниця), за винятком того, що 27 з 32 контрольних кодів присвоюються друкованим символам, один з яких HEX 80, символ валюти євро. Не всі платформи і операційні системи розпізнають CP-1252, тому документи, і зокрема веб-сторінки, вимагають особливої уваги.

    Поза 8 біт

    Для представлення азіатських мов потрібно набагато більше символів. В даний час ведеться активна розробка відповідних стандартів, і, як правило, вважається, що загальна кількість символів, які потрібно представити, менше 65 536. Це пощастило, тому що багато різних символів можуть бути представлені в 16 бітах, або 2 байтах. Для того, щоб залишатися в межах цього числа, письмові версії деяких китайських діалектів повинні ділитися символами, які виглядають однаково.

    Найсильніший кандидат на 2-байтовий стандартний код символів сьогодні відомий як Unicode.

    Довідка

    Існує багато веб-сторінок, які дають діаграму ASCII, з розширеннями для всіх мов світу. Серед більш корисних: