5.4: Читання - Всесвітня павутина

Last updated
Save as PDF

Page ID: 103956

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

Вступ

Всесвітня павутина (www, W3) - це інформаційний простір, де документи та інші веб-ресурси ідентифікуються URI,
взаємопов'язані гіпертекстовими посиланнями та можуть бути доступні через Інтернет. Він став відомий просто як Мережа. Гіпертекстові документи зазвичай називають веб-сторінками, які в основному є текстовими документами, відформатованими та анотованими мовою гіпертекстової розмітки (HTML). Веб-сторінки можуть містити посилання на зображення, відео та програмні компоненти, які відображаються користувачам програми веб-браузера, що працює на комп'ютері користувача, як цілісні сторінки мультимедійного контенту. Вбудовані гіперпосилання дозволяють користувачам переміщатися між веб-сторінками. Коли кілька веб-сторінок публікуються із загальною темою або в межах загального доменного імені, колекція зазвичай називається веб-сайтом.

Британський вчений Тім Бернерс-Лі є винахідником Мережі. Як співробітник CERN, Бернерс-Лі розповсюдив пропозицію 12 березня 1989 року про те, що врешті-решт стане Всесвітньою павутиною. Початкова пропозиція передбачала більш ефективну комунікаційну систему CERN, але Бернерс-Лі також усвідомив, що концепція може бути реалізована в усьому світі. Бернерс-Лі та бельгійський комп'ютерний вчений Роберт Кайліо запропонували в 1990 році використовувати гіпертекст «для зв'язку та доступу до інформації різного роду як павутину вузлів, в яких користувач може переглядати за бажанням», а Бернерс-Лі закінчив перший веб-сайт у грудні того ж року. Перший тест був завершений близько 20 грудня 1990 року і Бернерс-Лі повідомив про проект на newsgroup alt.hypertext 7 серпня 1991 року.

Історія

Комп'ютер NeXT, який використовував Тім Бернерс-Лі в ЦЕРН.

12 березня 1989 року Тім Бернерс-Лі видав пропозицію керівництву CERN, яка посилалася на ENQUIRE, проект бази даних та програмного забезпечення, який він побудував у 1980 році, і описав більш досконалу систему управління інформацією, засновану на посиланнях, вбудованих у читабельний текст: «Уявіть собі, тоді посилання в цьому документувати всі пов'язані з мережевою адресою речі, на яку вони посилалися, так що під час читання цього документа ви можете перейти до них клацанням миші.» Таку систему, пояснив він, можна було б посилатися на використання одного з існуючих значень слова гіпертекст, термін, який, за його словами, був придуманий у 1950-х роках. Немає причин, пропозиція продовжується, чому такі гіпертекстові посилання не могли охоплювати мультимедійні документи, включаючи графіку, мову та відео, так що Бернерс-Лі продовжує пропонувати термін гіпермедіа.

За допомогою Роберта Cailliau він опублікував більш офіційну пропозицію (12 листопада 1990 р.) побудувати «проект гіпертексту» під назвою «WorldWideWeb» (одне слово, також «W3») як «веб» з «гіпертекстових документів» для перегляду «браузерами» за допомогою архітектури клієнт-сервер. Ця пропозиція підрахувала, що Інтернет лише для читання буде розроблений протягом трьох місяців і що знадобиться шість місяців, щоб досягти «створення нових посилань та нових матеріалів читачами, [щоб] авторство стало універсальним», а також «автоматичне повідомлення читача, коли новий матеріал інтерес до нього/неї став доступний». Хоча мета лише для читання була досягнута, доступне авторство веб-контенту зайняло більше часу, щоб дозріти, з концепцією вікі, WebDAV, блогами, Web 2.0 та RSS/Atom.

Пропозиція була змодельована за зразком читача SGML Dynatext за допомогою технології електронних книг, спін-офф від Інституту досліджень інформації та стипендій при Університеті Брауна. Система Dynatext, ліцензована CERN, була ключовим гравцем у розширенні SGML ISO 8879:1986 до Hypermedia в HyTime, але вона вважалася занадто дорогою і мала невідповідну ліцензійну політику для використання в загальному співтоваристві фізики високих енергій, а саме плату за кожен документ і кожен документ. переробка.

Центр обробки даних CERN у 2010 році розмістив деякі сервери WWW

Комп'ютер NeXT був використаний Бернерс-Лі як перший у світі веб-сервер, а також написати перший веб-браузер, WorldWideWeb, в 1990 році. До Різдва 1990 року Бернерс-Лі створив усі інструменти, необхідні для роботи Інтернету: перший веб-браузер (який також був веб-редактором); перший веб-сервер; і перші веб-сторінки, які описували сам проект.

Перша веб-сторінка може бути втрачена, але Пол Джонс з UNC-Chapel Hill у Північній Кароліні оголосив у травні 2013 року, що Бернерс-Лі дав йому те, що, за його словами, є найстарішою відомою веб-сторінкою під час візиту до UNC 1991 року. Джонс зберігав його на магніто-оптичному приводі і на своєму комп'ютері NeXT.

6 серпня 1991 року Бернерс-Лі опублікував короткий зміст проекту Всесвітньої павутини в групі новин alt.hypertext. Ця дата також ознаменувала дебют Інтернету як загальнодоступної служби в Інтернеті, хоча нові користувачі отримували доступ до неї лише після 23 серпня. З цієї причини це вважається днем інтернату. Кілька ЗМІ повідомили, що перша фотографія в Інтернеті була опублікована Бернерс-Лі в 1992 році, зображення домашньої групи CERN Les Horribles Cernettes, зроблене Сільвано де Дженнаро; Дженнаро відмовився від цієї історії, написавши, що ЗМІ «повністю спотворюють наші слова заради дешевого сенсаціоналізму. »

Перший сервер за межами Європи був встановлений в Стенфордському центрі лінійного прискорювача (SLAC) в Пало-Альто, штат Каліфорнія, для розміщення бази даних SPIRES-HEP. Облікові записи суттєво відрізняються на дату цієї події. Консорціум Всесвітньої павутини говорить грудень 1992 року, тоді як сам SLAC стверджує 1991. Це підтримується документом W3C під назвою «Маленька історія всесвітньої павутини».

Основна концепція гіпертексту виникла в попередніх проектах 1960-х років, таких як система редагування гіпертексту (HES) в Університеті Брауна, проект Теда Нельсона Xanadu та On-line System Дугласа Енгельбарта (NLS). І Нельсон, і Енгельбарт, в свою чергу, були натхненні мікрофільмом Ванневар Буша мемекс, який був описаний в есе 1945 року «Як ми можемо думати».

Проривом Бернерса-Лі було одруження гіпертексту з Інтернетом. У своїй книзі Weaving The Web він пояснює, що неодноразово припускав, що шлюб між двома технологіями можливий для членів обох технічних спільнот, але коли ніхто не взяв його запрошення, він нарешті взяв на себе проект сам. У процесі роботи він розробив три основні технології:

система глобально унікальних ідентифікаторів ресурсів в Інтернеті та інших місцях, універсальний ідентифікатор документа (UDI), пізніше відомий як єдиний локатор ресурсів (URL) та єдиний ідентифікатор ресурсу (URI);
мова публікації HyperText Markup Language (HTML);
Протокол передачі гіпертексту (HTTP).

Всесвітня павутина мала ряд відмінностей від інших гіпертекстових систем, доступних на той час. Мережа вимагала лише однонаправлених посилань, а не двонаправлених, що дає можливість комусь посилатися на інший ресурс без дій з боку власника цього ресурсу. Це також значно зменшило складність реалізації веб-серверів і браузерів (в порівнянні з більш ранніми системами), але в свою чергу представляло хронічну проблему link rot. На відміну від попередників, таких як HyperCard, Всесвітня павутина була непатентованою, що дає можливість самостійно розробляти сервери і клієнти і додавати розширення без ліцензійних обмежень. 30 квітня 1993 року CERN оголосив, що Всесвітня павутина буде безкоштовною для будь-кого, без сплати плати. Через два місяці після оголошення про те, що серверна реалізація протоколу Gopher більше не була безкоштовною для використання, це спричинило швидкий перехід від Gopher та до Інтернету. Раннім популярним веб-браузером був ViolaWWW для Unix і X Windowing System.

Роберт Кайліо, Жан-Франсуа Абраматик з IBM та Тім Бернерс-Лі на 10-й річниці Консорціуму World Wide Web.

Вчені загалом погоджуються, що переломний момент для Всесвітньої павутини розпочався з впровадження веб-браузера Mosaic в 1993 році, графічного браузера, розробленого командою Національного центру суперкомп'ютерних додатків в Університеті штату Іллінойс в Урбана-Шампейн (NCSA-UIUC) на чолі з Марк Андреессен. Фінансування Mosaic надійшло від Ініціативи США з високопродуктивних обчислень та комунікацій та Закону про високопродуктивні обчислення та зв'язку 1991 року, одна з кількох обчислювальних розробок, ініційованих сенатором США Елом Гором. До випуску Mosaic графіка часто не змішувалася з текстом на веб-сторінках, а популярність Інтернету була меншою, ніж старі протоколи, використовувані через Інтернет, такі як Gopher та Wide Area Information Servers (WAIS). Графічний інтерфейс користувача Mosaic дозволив Мережі стати, безумовно, найпопулярнішим інтернет-протоколом.

Консорціум Всесвітньої павутини (W3C) був заснований Тім Бернерс-Лі після того, як він покинув Європейську організацію ядерних досліджень (ЦЕРН) у жовтні 1994 року. Він був заснований в Массачусетському технологічному інституті лабораторії комп'ютерних наук (MIT/LCS) за підтримки Агентства перспективних дослідницьких проектів оборони (DARPA), яке стало піонером Інтернету; через рік другий сайт був заснований в INRIA (французька національна лабораторія комп'ютерних досліджень) за підтримки від Європейської комісії DG InfSO; і в 1996, третій континентальний сайт був створений в Японії в Університеті Кейо. До кінця 1994 року загальна кількість веб-сайтів все ще була відносно невеликою, але багато відомих веб-сайтів вже були активними, які віщували або надихали найпопулярніші сьогодні сервіси.

Підключені існуючим Інтернетом, інші веб-сайти були створені по всьому світу, додавши міжнародні стандарти доменних імен і HTML. З тих пір Бернерс-Лі відігравав активну роль у керуванні розробкою веб-стандартів (таких як мови розмітки для створення веб-сторінок), і виступав за своє бачення семантичної павутини. Всесвітня павутина дозволила поширювати інформацію через Інтернет через простий у використанні і гнучкий формат. Таким чином, вона зіграла важливу роль у популяризації використання Інтернету. Хоча ці два терміни іноді об'єднуються в популярному використанні, Всесвітня павутина не є синонімом Інтернету. Веб - це інформаційний простір, що містить гіперпосилання документів та інших ресурсів, ідентифікованих їх URI. Він реалізований як клієнтським, так і серверним програмним забезпеченням з використанням інтернет-протоколів, таких як TCP/IP і HTTP.

Тім Бернерс-Лі був відданий в лицарі в 2004 році королева Єлизавета II за «послуги для глобального розвитку Інтернету».

Функція

Всесвітня павутина функціонує як шар поверх Інтернету, допомагаючи зробити його більш функціональним. Поява веб-браузера Mosaic допомогло зробити Інтернет набагато зручнішим.

Терміни Інтернет і Всесвітня павутина часто використовуються без особливої різниці. Однак дві речі не однакові. Інтернет - це глобальна система взаємопов'язаних комп'ютерних мереж. Навпаки, Всесвітня павутина є однією з послуг, що передаються через ці мережі. Це сукупність текстових документів та інших ресурсів, пов'язаних гіперпосиланнями та URL-адресами, до яких зазвичай звертаються веб-браузери, з веб-серверів.

Перегляд веб-сторінки у Всесвітній павутині зазвичай починається з введення URL-адреси сторінки в веб-браузері або за гіперпосиланням на цю сторінку або ресурс. Потім веб-браузер ініціює серію фонових повідомлень зв'язку для отримання та відображення запитуваної сторінки. У 1990-х роках використання браузера для перегляду веб-сторінок - і для переходу з однієї веб-сторінки на іншу за допомогою гіперпосилань - стало відомим як «перегляд», «веб-серфінг» (після серфінгу каналів) або «навігація по Інтернету». Ранні дослідження цієї нової поведінки досліджували шаблони користувачів у використанні веб-браузерів. Одне дослідження, наприклад, виявило п'ять моделей користувачів: пошуковий серфінг, серфінг вікон, розвинувся серфінг, обмежена навігація та цілеспрямована навігація.

Наступний приклад демонструє функціонування веб-браузера при доступі до сторінки за URL-адресою http://example.org/wiki/World_Wide_Web. Браузер вирішує ім'я сервера URL (example.org) в адресу Інтернет-протоколу за допомогою глобально розподіленої системи доменних імен (DNS). Цей пошук повертає IP-адресу, наприклад 203.0.113.4. Потім браузер запитує ресурс, надсилаючи HTTP-запит через Інтернет на комп'ютер за цією адресою. Він запитує службу від певного номера порту TCP, який добре відомий для служби HTTP, так що приймаючий хост може відрізнити HTTP запит від інших мережевих протоколів він може обслуговувати. Протокол HTTP зазвичай використовує порт номер 80. Зміст HTTP-запиту може бути простим, як два рядки тексту:

GET /wiki/World_Wide_Web HTTP/1.1
Host: example.org

Комп'ютер, який отримує HTTP-запит, доставляє його на веб-сервер програмного забезпечення прослуховування запитів на порт 80. Якщо веб-сервер може виконати запит, він надсилає HTTP-відповідь назад браузеру із зазначенням успіху:

HTTP/1.0 200 OK
Content-Type: text/html; charset=UTF-8

за яким слід вміст запитуваної сторінки. Мова розмітки гіпертексту для основної веб-сторінки виглядає як <html><head><title>Example.org - Всесвітня павутина</title></head> <body><p>Всесвітня павутина, скорочено WWW і широко відомий...</p></body></html>

Веб-браузер аналізує HTML і інтерпретує розмітку (<title>, <p>для абзацу, і таку), яка оточує слова для форматування тексту на екрані. Багато веб-сторінок використовують HTML для посилання на URL-адреси інших ресурсів, таких як зображення, інші вбудовані носії інформації, скрипти, що впливають на поведінку сторінки, і каскадні таблиці стилів, які впливають на макет сторінки. Браузер робить додаткові HTTP-запити до веб-сервера для цих інших типів інтернет-носіїв. Коли він отримує їх вміст з веб-сервера, браузер поступово відображає сторінку на екран, як зазначено його HTML та цими додатковими ресурсами.

Посилання

Більшість веб-сторінок містять гіперпосилання на інші пов'язані сторінки і, можливо, на завантажувані файли, вихідні документи, визначення та інші веб-ресурси. У базовому HTML гіперпосилання виглядає як <a href=» http://example.org/wiki/Main_Page «> Example.org, вільна енциклопедія</a>

Графічне зображення хвилинної частки WWW, що демонструє гіперпосилання.

Така сукупність корисних, пов'язаних між собою ресурсів, пов'язаних між собою за допомогою гіпертекстових посилань, охрестили інформаційною павутиною. Публікація в інтернеті створила те, що Тім Бернерс-Лі вперше назвав Всесвітньою павутиною (в своєму оригінальному CamelCase, який згодом був відкинутий) в листопаді 1990 року.

Структура гіперпосилань WWW описується веб-графом: вузли веб-графа відповідають веб-сторінкам (або URL-адресам), спрямованим ребрам між ними гіперпосилань.

Згодом багато веб-ресурсів, на які вказують гіперпосилання, зникають, переміщуються або замінюються різним вмістом. Це робить гіперпосилання застарілими, явище, яке в деяких колах називають гниллю посилань, а гіперпосилання, на які впливає, часто називають мертвими посиланнями. Ефемерний характер Інтернету спонукав багато зусиль для архівування веб-сайтів. Інтернет-архів, що діє з 1996 року, є найвідомішим з таких зусиль.

Динамічні оновлення веб-сторінок

JavaScript - це мова сценаріїв, яка спочатку була розроблена в 1995 році Бренданом Айхом, потім Netscape, для використання на веб-сторінках. Стандартизованою версією є ECMAScript. Щоб зробити веб-сторінки більш інтерактивними, деякі веб-додатки також використовують методи JavaScript, такі як Ajax (асинхронний JavaScript і XML). Сценарій на стороні клієнта поставляється зі сторінкою, яка може робити додаткові HTTP-запити на сервер, або у відповідь на дії користувача, такі як переміщення миші або кліки, або на основі часу, що минув. Відповіді сервера використовуються для зміни поточної сторінки, а не створення нової сторінки з кожною відповіддю, тому серверу потрібно лише надавати обмежену, додаткову інформацію. Кілька запитів Ajax можуть оброблятися одночасно, і користувачі можуть взаємодіяти зі сторінкою під час отримання даних. Веб-сторінки також можуть регулярно опитувати сервер, щоб перевірити, чи доступна нова інформація.

Префікс WWW

Багато імена хостів, які використовуються для Всесвітньої павутини, починаються з www через давню практику іменування інтернет-хостів відповідно до послуг, які вони надають. Ім'я хоста веб-сервера часто www, так само, як це може бути ftp для FTP-сервера, і новини або nntp для сервера новин USENET. Ці імена хостів відображаються як система доменних імен (DNS) або імена субдоменів, як на веб-сайті www.example.com. Використання www не вимагається жодним технічним або політичним стандартом, і багато веб-сайтів не використовують його; дійсно, перший веб-сервер називався nxoc01.cern.ch. За словами Паоло Палацці, який працював у ЦЕРН разом з Тімом Бернерсом-Лі, популярне використання www як субдомену було випадковим; сторінка проекту World Wide Web мала бути опублікована на www.cern.ch, тоді як info.cern.ch мав бути домашньою сторінкою CERN, однак записи DNS ніколи не були переключився, і практика додавання www до доменного імені веб-сайту установи була згодом скопійована. Багато відомих веб-сайтів все ще використовують префікс, або вони використовують інші субдоменні імена, такі як www2, secure або en для спеціальних цілей. Багато таких веб-серверів налаштовані таким чином, що як основне доменне ім'я (наприклад, example.com), так і піддомен www (наприклад, www.example.com) посилаються на один і той же сайт; інші вимагають тієї чи іншої форми, або вони можуть відображатися на різних веб-сайтах.

Використання імені піддомену корисно для балансування навантаження вхідного веб-трафіку шляхом створення запису CNAME, який вказує на кластер веб-серверів. Оскільки в даний час в CNAME можна використовувати лише субдомен, такого ж результату неможливо досягти за допомогою голого кореня домену.

Коли користувач надсилає неповне доменне ім'я веб-браузеру у полі введення адресного рядка, деякі веб-браузери автоматично намагаються додати префікс «www» на початок і, можливо, «.com», «.org» та «.net» наприкінці, залежно від того, чого може бути відсутнім. Наприклад, введення «Microsoft» може бути перетворено на http://www.microsoft.com/ та «openoffice» на http://www.openoffice.org. Ця функція почала з'являтися в ранніх версіях Mozilla Firefox, коли вона все ще мала робочу назву «Firebird» на початку 2003 року, з більш ранньої практики в браузерах, таких як Lynx. Повідомляється, що Microsoft отримала патент США на ту ж ідею в 2008 році, але тільки на мобільні пристрої.

В англійській мові www зазвичай читається як double-u double-u double-u. Деякі користувачі вимовляють його dub-dub-dub, особливо в Новій Зеландії. Стівен Фрай у своїй серії подкастів «Програми» вимовляє це whh wh wh wh. Англійський письменник Дуглас Адамс колись кинув у The Independent on Sunday (1999): «Всесвітня павутина - це єдине, про що я знаю, чия скорочена форма займає три рази більше часу, щоб сказати, ніж те, що вона коротка». На китайській китайській мові Всесвітня павутина зазвичай перекладається за допомогою фоно-семантичного узгодження wàn wéi wng (), що задовольняє www і буквально означає «незліченна розмірна мережа», переклад, який відображає концепцію дизайну та розповсюдження Всесвітньої павутини. Веб-простір Тіма Бернерса-Лі стверджує, що Всесвітня павутина офіційно пишеться як три окремі слова, кожне з великих, без інтервенційних дефісів.

Використання префікса www зменшується, оскільки веб-додатки Web 2.0 прагнуть брендувати свої доменні імена та зробити їх легко вимовними. У міру зростання популярності мобільного Інтернету такі сервіси, як Gmail.com, MySpace.com, Facebook.com і Twitter.com найчастіше згадуються без додавання «www». (або, дійсно, «.com») до домену.

Специфікатори схеми

Специфікатори схеми http://і https://на початку веб-URI посилаються на протокол передачі гіпертексту або HTTP Secure відповідно. Вони вказують протокол зв'язку, який слід використовувати для запиту та відповіді. Протокол HTTP є основоположним для роботи Всесвітньої павутини, а доданий рівень шифрування в HTTPS має важливе значення, коли браузери надсилають або отримують конфіденційні дані, такі як паролі або банківську інформацію. Веб-браузери зазвичай автоматично дописують http://до введеного користувачем URI, якщо їх не вказано.

Безпека в Інтернеті

Для злочинців Інтернет став кращим способом поширення шкідливих програм. Кіберзлочинність в Інтернеті може включати крадіжку особистих даних, шахрайство, шпигунство та збір розвідки. Веб-уразливості тепер перевищують кількість традиційних проблем комп'ютерної безпеки, і, як вимірюється Google, приблизно кожна десята веб-сторінок може містити шкідливий код. Більшість веб-атак відбувається на законних веб-сайтах, і більшість, як вимірюється Sophos, розміщуються в США, Китаї та Росії. Найпоширенішою з усіх загроз шкідливих програм є атаки SQL-ін'єкцій на веб-сайти. Через HTML та URI Інтернет був вразливий до атак, таких як міжсайтовий скриптинг (XSS), які прийшли з впровадженням JavaScript і були в деякій мірі посилені Web 2.0 і Ajax веб-дизайн, який сприяє використанню сценаріїв.Сьогодні, за однією оцінкою, 70% всіх веб-сайтів відкриті для XSS атак на своїх користувачів. P hishing - ще одна поширена загроза для Мережі. «SA, відділ безпеки EMC, сьогодні оголосив результати свого звіту про шахрайство за січень 2013 року, оцінивши глобальні втрати від фішингу в 1,5 мільярда доларів у 2012 році». Два з відомих методів фішингу - приховане перенаправлення та відкрите перенаправлення.

Пропоновані рішення варіюються в крайності. Великі постачальники безпеки, такі як McAfee, вже розробляють пакети управління та дотримання вимог відповідно до правил після 9/11, а деякі, наприклад Finjan, рекомендували активну перевірку коду та всього вмісту в режимі реального часу незалежно від його джерела. Деякі стверджували, що для того, щоб підприємство розглядало безпеку як можливість бізнесу, а не центр витрат, «повсюдне, завжди на управління цифровими правами», що застосовується в інфраструктурі кількома організаціями, повинні замінити сотні компаній, які сьогодні захищають дані та мережі. Джонатан Зіттрейн сказав, що користувачі поділяють відповідальність за безпеку обчислень набагато краще, ніж блокування Інтернету.

Конфіденційність

Кожен раз, коли клієнт запитує веб-сторінку, сервер може визначити IP-адресу запиту і зазвичай реєструє його. Крім того, якщо не встановлено цього, більшість веб-браузерів записують запитані веб-сторінки у видимій історії та зазвичай кешують значну частину вмісту локально. Якщо зв'язок сервер-браузер не використовує шифрування HTTPS, веб-запити та відповіді подорожують у звичайному тексті через Інтернет і можуть бути переглянуті, записані та кешовані проміжними системами.

Коли веб-сторінка запитує, а користувач надає особисту інформацію, таку як їхнє справжнє ім'я, адресу, адресу електронної пошти тощо, веб-об'єкти можуть пов'язувати поточний веб-трафік з цією особою. Якщо веб-сайт використовує HTTP-файли cookie, автентифікацію імені користувача та пароля або інші методи відстеження, він може пов'язати інші веб-відвідування, до та після, з наданою ідентифікаційною інформацією. Таким чином, веб-організація може розробити та створити профіль окремих людей, які використовують її сайт або сайти. Це може бути в змозі побудувати запис для особи, яка включає інформацію про їх дозвілля, їх торгові інтереси, професії та інші аспекти їх демографічного профілю. Ці профілі, очевидно, представляють потенційний інтерес для маркетологів, рекламодавців та інших. Залежно від умов веб-сайту та місцевих законів, які застосовують інформацію з цих профілів, можуть продаватися, передаватися або передаватися іншим організаціям без повідомлення користувача. Для багатьох звичайних людей це означає трохи більше, ніж деякі несподівані електронні листи в їхній коробці або якась надзвичайно релевантна реклама на майбутній веб-сторінці. Для інших це може означати, що час, витрачений на потурання незвичайному інтересу, може призвести до потоку подальшого цільового маркетингу, який може бути небажаним. Правоохоронні органи, контртерористичні та шпигунські органи також можуть ідентифікувати, націлювати та відстежувати осіб на основі їх інтересів або схильності в Інтернеті.

Сайти соціальних мереж намагаються змусити користувачів використовувати свої справжні імена, інтереси та місця розташування. Вони вважають, що це робить досвід соціальних мереж більш реалістичним, а отже, більш привабливим для всіх своїх користувачів. З іншого боку, завантажені фотографії або незахищені заяви можуть бути ідентифіковані особі, яка може пошкодувати про цю експозицію. На роботодавців, шкіл, батьків та інших родичів можуть впливати аспекти профілів соціальних мереж, які публікаційна особа не має наміру для цих аудиторій. Онлайн-хулігани можуть використовувати особисту інформацію для переслідування або переслідування користувачів. Сучасні веб-сайти соціальних мереж дозволяють дрібно зернистий контроль налаштувань конфіденційності для кожного окремого розміщення, але вони можуть бути складними і нелегко знайти або використовувати, особливо для початківців.

14162668916_аее0е61е2_к

Фотографії та відео, розміщені на веб-сайтах, спричинили особливі проблеми, оскільки вони можуть додати обличчя людини до он-лайн профілю. Завдяки сучасній та потенційній технології розпізнавання обличчя, можливо, можна пов'язати це обличчя з іншими, раніше анонімними зображеннями, подіями та сценаріями, які були зображені в іншому місці. Через кешування, дзеркального відображення і копіювання зображень важко видалити зображення з Всесвітньої павутини.

Стандарти

Багато формальних стандартів та інших технічних специфікацій та програмного забезпечення визначають роботу різних аспектів Всесвітньої павутини, Інтернету та комп'ютерного обміну інформацією. Багато документів є роботою Консорціуму Всесвітньої павутини (W3C), очолюваного Бернерсом-Лі, але деякі виробляються Інтернет-інженерної цільовою групою (IETF) та іншими організаціями.

Зазвичай, коли обговорюються веб-стандарти, такі публікації розглядаються як основоположні:

Рекомендації щодо мов розмітки, особливо HTML та XHTML, від W3C. Вони визначають структуру та інтерпретацію гіпертекстових документів.
Рекомендації щодо таблиць стилів, особливо CSS, від W3C.
Стандарти ECMAScript (зазвичай у вигляді JavaScript), від Ecma International.
Рекомендації щодо об'єктної моделі документа, від W3C.

Додаткові публікації дають визначення інших необхідних технологій для Всесвітньої павутини, включаючи, але не обмежуючись цим, такі:

Уніфікований ідентифікатор ресурсу (URI), який є універсальною системою посилань на ресурси в Інтернеті, такі як гіпертекстові документи і зображення. URI, часто звані URL-адресами, визначаються IETF RFC 3986/ STD 66: Уніфікований ідентифікатор ресурсу (URI): Generic Syntax, а також його попередники та численні URI схеми, що визначають RFC;
Протокол передачі гіпертексту (HTTP), особливо як визначено RFC 2616: HTTP/1.1 та RFC 2617: HTTP Authentication, які визначають, як браузер і сервер автентифікують один одного.

Доступність

Існують методи доступу до Інтернету в альтернативних середовищах та форматах для полегшення використання особами з обмеженими можливостями. Ці порушення можуть бути зоровими, слуховими, фізичними, мовними, когнітивними, неврологічними або деякими комбінаціями. Функції доступності також допомагають людям з тимчасовими вадами, такими як зламана рука, або старіючим користувачам, коли їх здібності змінюються. Інтернет отримує інформацію, а також надає інформацію та взаємодіє з суспільством. Консорціум World Wide Web стверджує, що важливо, щоб Інтернет був доступним, щоб вона могла забезпечити рівний доступ і рівні можливості для людей з обмеженими можливостями. Тім Бернерс-Лі одного разу зазначив: «Сила Мережі в її універсальності. Доступ для всіх, незалежно від інвалідності, є важливим аспектом». Багато країн регулюють доступність Інтернету як вимогу до веб-сайтів. Міжнародне співробітництво в рамках Ініціативи веб-доступності W3C призвело до простих рекомендацій, які автори веб-контенту, а також розробники програмного забезпечення можуть використовувати, щоб зробити Інтернет доступним для осіб, які можуть або не можуть використовувати допоміжні технології.

Інтернаціоналізація

Діяльність з інтернаціоналізації W3C гарантує, що веб-технології працюють на всіх мовах, сценаріях та культурах. Починаючи з 2004 або 2005 року, Unicode здобув позицію і врешті-решт у грудні 2007 перевершив як ASCII, так і західноєвропейський як найбільш часто використовуване кодування символів в Інтернеті. Спочатку RFC 3986 дозволяв ідентифікувати ресурси за URI в підмножині US-ASCII. RFC 3987 дозволяє більше символів - будь-який символ у універсальному наборі символів, і тепер ресурс може бути ідентифікований IRI будь-якою мовою.

Статистика

У період з 2005 по 2010 рік кількість веб-користувачів подвоїлася і, як очікується, перевищить два мільярди в 2010 році. Ранні дослідження в 1998 та 1999 роках оцінки розміру Інтернету за допомогою методів захоплення/відновлення показали, що значна частина Інтернету не індексувалася пошуковими системами, а Інтернет був набагато більшим, ніж очікувалося. Згідно з дослідженням 2001 року, існує величезна кількість, понад 550 мільярдів, документів в Інтернеті, переважно в невидимій мережі або глибокій павутині. Опитування 2002 року 2024 мільйона веб-сторінок показало, що найбільша кількість веб-контенту була англійською мовою: 56,4%; далі були сторінки німецькою (7,7%), французькою (5,6%) та японською (4,9%). Більш недавнє дослідження, яке використовувало пошуки в Інтернеті на 75 різних мовах для вибірки Інтернету, визначило, що станом на кінець січня 2005 року в загальнодоступній мережі було понад 11,5 мільярда веб-сторінок. Станом на березень 2009 року індексувана мережа містить щонайменше 25,21 мільярда сторінок. 25 липня 2008 року інженери програмного забезпечення Google Джессі Альперт і Nissan Hajaj оголосили, що Google Search виявив один трильйон унікальних URL-адрес. Станом на травень 2009 року функціонувало понад 109,5 млн доменів. З них 74% були комерційними або іншими доменами, що працюють в загальному домені верхнього рівня com.

Статистика, що вимірює популярність веб-сайту, як правило, базується або на кількості переглядів сторінок, або на пов'язаних серверах «звернень» (запитів на файли), які він отримує.

Проблеми зі швидкістю

Розчарування через проблеми із завантаженістю в інфраструктурі Інтернету та висока затримка, що призводить до повільного перегляду, призвели до принизливої назви Всесвітньої павутини: World Wide Wide Wait. Прискорення роботи в Інтернеті - це постійна дискусія щодо використання технологій пірингу та QoS. Інші рішення для зменшення заторів можна знайти на W3C. Керівні принципи щодо часу веб-відповіді:

0,1 секунди (одна десята секунди). Ідеальний час відгуку. Користувач не відчуває ніякого переривання.
1 секунда. Найвищий прийнятний час відгуку. Час завантаження вище 1 секунди перериває користувальницький досвід.
10 секунд. Неприйнятний час відгуку. Користувальницький досвід переривається, і користувач, швидше за все, покине сайт або систему.

Веб-кешування

Веб-кеш - це серверний комп'ютер, розташований або в загальнодоступному Інтернеті, або в межах підприємства, яке зберігає нещодавно доступні веб-сторінки, щоб покращити час відгуку для користувачів, коли той самий вміст запитується протягом певного часу після вихідного запиту.

Більшість веб-браузерів також реалізують кеш браузера для недавно отриманих даних, як правило, на локальному диску. HTTP-запити браузером можуть запитувати тільки дані, які змінилися з моменту останнього доступу. Веб-сторінки та ресурси можуть містити інформацію про закінчення терміну дії для контролю кешування для захисту конфіденційних даних, наприклад, в онлайн-банкінгу, або для полегшення часто оновлюваних сайтів, таких як ЗМІ новин. Навіть сайти з високодинамічним вмістом можуть дозволити оновлювати базові ресурси лише зрідка. Дизайнери веб-сайтів вважають доцільним зібрати ресурси, такі як дані CSS та JavaScript, у кілька файлів на всьому сайті, щоб їх можна було ефективно кешувати.

Корпоративні брандмауери часто кешують веб-ресурси, запитані одним користувачем на благо багатьох. Деякі пошукові системи зберігають кешований вміст часто відвідуваних веб-сайтів.

Всесвітня павутина. Надано: Вікіпедія. Знаходиться за адресою: https://en.wikipedia.org/wiki/World_Wide_Web#See_also. Ліцензія: CC BY-SA: Із Зазначенням Авторства
Зняття селфі. Автор: Сюзанна Нільссон. Знаходиться за адресою: https://www.flickr.com/photos/infomastern/14162668916/. Ліцензія: CC BY-SA: Із Зазначенням Авторства
Всесвітня павутина. Автор: Сандра_шон. Знаходиться за адресою: https://pixabay.com/en/world-wide-web-www-lettering-world-341418/. Ліцензія: CC0: Немає прав захищено