Skip to main content
LibreTexts - Ukrayinska

2: Дані

  • Page ID
    37834
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    Милуючись добре розробленою картою, легко забути, що вона зроблена з даних, які звідкись надійшли. Людина або група людей задали одне або кілька запитань, зібрали дані у відповідь та обробляли необроблені цифри, перш ніж розміщувати все це на карті. Ці дані обов'язково є лише невеликою частиною того, що можна виміряти, адже неможливо виміряти всі характеристики для всіх місць за всі часи. Натомість ми зосереджуємося на тому, як і навіщо збиралися дані для чого, де і коли.

    Цей розділ познайомить вас з:

    • Елементи та поширені типи просторових даних.
    • Метадані, або дані про дані.
    • Як збираються та агрегуються дані перепису населення США - опитування, яке лежить в основі багатьох прикладів та заходів у цій книзі.

    Роздільна здатність, точність та сумісність — важливі поняття, які є частиною метаданих і про які важливо пам'ятати при виборі відповідних даних для проекту.

    До кінця цієї глави ви повинні мати можливість задати продумані питання про дані, які використовуються в картографуванні.

    2.1 Що таке просторові дані?

    Дані карти мають три ключові характеристики:

    • Просторовий — де знаходиться об'єкт або сталася подія
    • Тимчасові — коли розташування та атрибути були точними (тобто коли зібрані)
    • Атрибут — які характеристики має об'єкт або подія

    Уявіть, що у нас є дані про штати США. Просторові характеристики даних, а саме розташування державних меж, необхідні для розміщення даних на карті або використання. У більш широкому плані просторова інформація може мати форму адреси вулиці, координат широти та довготи або місцевості, в якій збиралися дані (наприклад, житловий квартал, місто, штат, країна). Тимчасові характеристики стосуються того, як дані представляють собою «знімок» того, якими були речі на момент збору даних, наприклад, даних перепису за 2000 рік. Нарешті, характеристики атрибутів описують характер розташування. Що стосується штатів, ми можемо бути стурбовані населенням чи доходами або будь-якою з сотень інших характеристик.


    Таблиця даних і карта. Ця таблиця атрибутів та пов'язана карта показують межі штату з даними Бюро перепису населення США про щільність населення. Таблиця та карта представляють два ключові елементи просторових даних: розташування та атрибути. Третя важлива частина, не показана, - це час, коли ці дані були зібрані. [1]

    2.2 Збір просторових даних

    Двома основними методами збору просторових даних, або збору інформації про місця, є геодезія землі та дистанційне зондування. Геодезія передбачає, що людина або механізм спостерігає або взаємодіє з людьми або навколишнім середовищем в конкретному місці. Дистанційне зондування відноситься до збору даних здалеку, часто шляхом фотографування з літака або супутника.

    2.2.1 Геодезія грунту

    Геодезія грунту проводиться за допомогою індивідуального або механізму, що взаємодіє з конкретним місцем. Це може включати людину, яка збирає дані про місцезнаходження за допомогою телефону, який працює з глобальною системою позиціонування (GPS), сузір'ям супутників, які передають сигнали на землю, де вони можуть бути використані для визначення положення. Опитування включають розмову з людьми або подорожі в різні місця для збору інформації. Інший вид геодезії грунту відбувається на метеостанціях, які вимірюють температуру та іншу кліматологічну інформацію в даному місці. Це схоже на процес, який називається геокодуванням, де дані з елементом розташування, таким як адреса або поштовий індекс, узгоджуються з відповідними координатами землі, які вже відомі.

    Геодезія - один з найдавніших методів визначення місця розташування. По суті, землевпорядники використовують різноманітні інструменти для визначення точних положень локацій шляхом тріангуляції з положення відомих місць або іншими словами, використовуючи математику кутів і відстаней для пошуку локацій. Геодезія існує вже тисячі років, ймовірно, бере свій початок як спосіб визначення меж земельних ділянок і допомоги в будівництві великих будівель. Починаючи з 1800-х років, землевпорядники допомогли скласти карту багатьох країн, працюючи назовні від відомих до невідомих місць.


    Геодезія. Фундамент сучасного картографування заклали люди, що гуляють та вимірюють землю спеціалізованими телескопами (зліва) та сучасними тахеометами з підтримкою GPS (праворуч). [2] [3]

    Глобальні системи позиціонування (GPS) - це сузір'я супутників, які обертаються навколо Землі. Ці супутники передають на земну поверхню сигнали, які вказують на їх положення в просторі і дуже точний сигнал часу. Пристрій, оснащений відповідним GPS-приймачем, може інтерпретувати ці сигнали і визначати місце розташування пристрою на землі. Ми розглядаємо використання пристрою GPS для пошуку місця розташування формою наземної зйомки, оскільки самі супутники не збирають інформацію; саме телефон або блок GPS визначає положення за сигналами супутника.


    GPS сузір'я. Глобальна система позиціонування - це система або сузір'я супутників, що обертаються навколо Землі, які дозволяють телефонам встановлювати місце розташування. [4]

    Протягом десятиліть точне розташування об'єктів за допомогою GPS-блоків вимагало дорогого обладнання та спеціалізованої підготовки. Її здійснювали в першу чергу військові, науковці, урядові організації. Завдяки технологічним розробкам, що роблять комп'ютерні чіпи меншими та швидшими, GPS-приймачі тепер стандартні в мобільних телефонах. Будь-яка людина може записати, або позначити, місце, де був зроблений знімок, або відстежувати щоденні рухи без спеціальної експертизи. Ця простота використання істотно розширює, хто здатний створювати просторові дані та обсяг просторових даних, які існують і повинні зберігатися.

    GPS мають свої недоліки. Оскільки телефони повинні приймати сигнали від супутників, що обертаються навколо землі, ці сигнали можуть бути заблоковані твердими об'єктами, такими як дерева, будівлі або ландшафтні особливості, такі як сторони тунелів або ярів. Отримати сильний сигнал в помірно лісистій місцевості може бути важко, як і отримати його в місті з високими будівлями. Існує обмежена кількість супутників, що обертаються навколо Землі, і бувають випадки, коли телефон знаходиться в неоптимальному положенні щодо цих супутників. Телефон GPS повинен приймати сигнали щонайменше від чотирьох супутників, і в ідеалі більше, які розподілені рівномірно в небі, але бувають випадки, коли ці джерела згруповані відносно положення трубки і координати, які він надає, будуть неточними. Нарешті, залежно від якості телефону, GPS-координати також можуть бути неточними, коли телефон швидко рухається, наприклад, в автомобілі чи літаку. Зверніть увагу, що, загалом, сильна погода, така як сніг, дощ або хмари, не заважають GPS-сигналам.


    GPS телефон. Трубки мають спеціалізовані радіостанції та комп'ютери, які приймають сигнали від супутників GPS, а потім визначають місце розташування. [5]

    Геокодування - це процес приєднання географічного розташування до якоїсь адресної інформації, наприклад, адреси будинку або поштового індексу, або словесного опису, такого як «перетин проспекту В'язів та Головної вулиці». Геокодування приймає ряд різних форм, але більшість використовує певну форму бази даних адрес, місця розташування яких точно відомі. Нерозміщені адреси збігаються з цими відомими адресами в базі даних.


    Геокодування передбачає узгодження адрес вулиць з відомими адресами або найкращими здогадками на основі діапазонів вуличних адрес уздовж вулиць вже на карті. [6]

    Опитування збирають атрибути інформацію про осіб, домогосподарства, підприємства, або області. Не всі опитування збирають просторову інформацію, але коли вони роблять, дані можуть бути пов'язані з місцем розташування на карті. Опитування можуть бути відправлені по пошті домогосподарствам, зібрані особисто, або проведені по телефону. Зазвичай вони зосереджені на певній субпопуляції або діяльності (наприклад, уявлення студентів про безпеку ходьби додому). Перепис — це особливий тип опитування, який збирає дані про всіх членів населення (наприклад, з метою всіх жителів країни). Зверніть увагу, що інформація про опитування, як правило, є інформацією про атрибут, і визначення місця розташування вимагає геокодування (як у випадку з поштовим опитуванням, який записує адресу особи, яка опитується) або використання телефону GPS особою, яка приймає опитування. Інший вид опитування відбувається, коли такі компанії, як Google, оснащують автомобілі GPS-приймачами та камерами та їздять навколо запису фотографій свого оточення.

    Датчики. Зростає кількість датчиків, що використовуються для вимірювання широкого спектру людських та екологічних фактів. Наприклад, ми давно мали кліматичні станції, які вимірюють багато змінних, включаючи температуру, сонячне світло та опади. Місця розташування цих датчиків визначаються за допомогою GPS, наземної зйомки або геокодування.


    Станція спостереження за кліматом. Наземні станції, такі як ці, збирають інформацію про погоду. [7]

    2.2.2 Дистанційне зондування

    Як випливає з назви, дані дистанційного зондування збираються на відстані від досліджуваного ними об'єкта. Ці дані зазвичай збираються датчиками, встановленими на літаках, супутниках або безпілотниках. Деякі датчики збирають зображення з камерами, які працюють по суті за тими ж принципами, що і в портативній плівковій камері або цифровій камері стільникового телефону. Ці камери збирають видиме світло, яке можуть розпізнати людські очі. Інші датчики виявляють різні невидимі частини електромагнітного спектра, такі як інфрачервоний (тепловий). Треті можуть активно сканувати землю за допомогою таких технологій, як радар.


    Супутникова зйомка. Фарбування супутника дистанційного зондування Землі Landsat 7. Зауважте, що супутник насправді не кидає чотиристоронній промінь світла на поверхню Землі, це лише художня ліцензія. Натомість датчики супутника фіксують електромагнітну енергію, відбиту або випромінювану Землею. [8]

    Ймовірно, ви бачили віддалені дані як базову карту для карт Google або інших онлайн-карт. Ці зображення також використовуються для широкого спектру цілей, особливо для моніторингу змін у навколишньому середовищі на великих територіях, таких як вирубка лісів в Амазонії або розливи нафти.


    Супутниковий знімок нафтової плями. Зображення з космосу нафтової плями від аварії Deepwater Horizon в Мексиканській затоці (24 травня 2010). [9]

    Фото також робляться літаками і безпілотниками. Одним з найпоширеніших застосувань є фотографування земної поверхні. Ці фотографії потім перетворюються професіоналами картографування в карти землі.


    Повітряна фотограмметрія. Фотограмметрія - це процес зняття вимірювань землі з фотографій землі з метою внесення необхідних для карт даних. [10]

    2.3 Метадані

    При роботі з картами ви часто будете використовувати дані, які ви не створювали. Метадані допомагають визначити, чи підходять дані на карті для вашого запитання чи проекту. Метадані — це дані про дані. Зазвичай нас найбільше цікавлять просторові, часові та атрибути характеристики даних, але метадані йдуть далі та надають інформацію, включаючи:

    • Хто збирав дані?
    • Як збиралися та класифікувалися дані?
    • Коли були зібрані дані?
    • Наскільки точні дані?
    • Яка роздільна здатність даних? (Детальніше про це нижче!)

    Будьте обережні, використовуючи карту, якщо ви не можете знайти метадані. Ця обережність особливо важлива, оскільки метадані дозволяють оцінити, наскільки добре дані можуть працювати з іншими даними. Нижче ми розглянемо питання роздільної здатності, точності та сумісності між наборами даних. Картографи вивчають ці проблеми, а потім додають їх до метаданих, прикріплених до карти.

    2.4 Дані перепису

    Важливою формою даних опитування є дані перепису або дані, зібрані національними урядами щодо їх населення. Ми використовуємо приклад даних перепису, зібраних Бюро перепису населення США, оскільки перепис є основним джерелом соціальних даних, які використовуються урядом, некомерційними організаціями та підприємствами. Ці дані створюються за допомогою добре документованих процедур і доступні в різних масштабах для всієї нації. Нарешті, багато безкоштовних онлайн-картографічних інструментів надають дані перепису, що дозволяє досліджувати концепції картографування без суворої технічної підготовки.

    2.4.1 Передумови до перепису

    Перепис населення США проводиться кожні десять років з метою підрахунку кожної людини в країні, хоча, як описано нижче, досягти цієї мети практично неможливо. Перепис збирає інформацію про расу, вік та житлове становище населення. Основна мета перепису, як встановлено в Конституції, полягає у визначенні кількості місць, які кожен штат матиме в Палаті представників США, законодавчій гілці влади. Межі виборчих округів повинні бути перемальовані в державах, які отримали або втратили місця між роками перепису (ми детальніше розглянемо, як робиться переділення та просторові проблеми процесу в наступних розділах). Переписи також визначають, як сотні мільярдів доларів федерального фінансування розподіляються для багатьох важливих цілей, включаючи освіту, охорону здоров'я, охорону навколишнього середовища, транспорт та інші форми федеральної допомоги штатам та містам.

    Перша перепис населення США, проведена в 1791 році шістнадцятьма американськими маршалами і 650 помічниками, нарахувала близько 3,9 мільйона чоловік. Вони задавали лише кілька питань: кількість вільних осіб, кількість рабів, стать і раса кожної людини.


    Форма перепису 1791 року. Цю форму для першого перепису населення в США заповнив перепис, який поставив кілька запитань. [11]

    До 1960 року, коли населення наближається до 180 мільйонів, було вже неможливо, щоб учасник перепису відвідував кожне домогосподарство. Натомість анкети надсилалися поштою кожному домогосподарству, а тимчасові працівники особисто слідкували за домогосподарствами, які не відповіли.


    Форма перепису 1960 року. Це порожня копія форми перепису 1960 року, яка була надіслана поштою кожному домогосподарству для заповнення. [12]

    Питання, що задаються всім домогосподарствам, тепер включають кількість осіб за віком, статтю, етнічною приналежністю, домоволодінням та складом домогосподарств. Між 1940 і 2000 роками кожне шосте домогосподарства також отримало більш детальне опитування «довгої форми», яке задавало питання щодо набагато ширшого кола тем, включаючи доходи, заняття, тривалість поїздки та військову службу. Потім Бюро перепису населення використовувало цю вибірку для оцінки характеристик решти населення.

    Попит на більш своєчасні соціальні дані призвів до розвитку американського опитування спільноти (ACS), яке замінило тривалу форму опитування перепису населення в 2010 році. АСУ проводиться щороку з метою надання більш частих «знімків» демографічних, економічних, житлових особливостей населення. Однак лише 2-3 мільйони домогосподарств отримують опитування на рік (менше 2% населення), що вводить суттєві статистичні помилки в оцінках для всього населення. Дані для перепису населення та СКУД збираються від кожного домогосподарства, але для того, щоб зберегти конфіденційність та полегшити використання даних, Бюро перепису населення агрегує дані у більші географічні райони.

    Хоча дані доступні для великої кількості різних географічних районів, ми будемо працювати в основному з переписними районами та округами в цьому курсі. Урочища перепису мають чисельність населення від 1200 до 8000 чоловік, з оптимальним розміром 4000 людей. Межі перепису тракту, як правило, відповідають екологічним або політичним особливостям, але просторовий розмір переписних ділянок може сильно відрізнятися залежно від щільності поселення та населення. Межі та форми перепису тракту намальовані з метою, що вони залишатимуться майже однаковими протягом тривалого часу, щоб статистичні порівняння можна було проводити від перепису до перепису.

    2.4.2 Обмеження даних перепису

    Перепис є найбільш повним джерелом демографічної інформації, доступною для Сполучених Штатів, але вона все ще має важливі обмеження.

    Першочерговим завданням є точність і недолік. Перепис намагається зробити знімок того, скільки людей є і де вони живуть на 1 квітня року перепису. Метод збору даних передбачає, що кожна людина проживає в житловому блоці з поштовою адресою і що вони будуть точно реагувати на опитування. Бюро перепису населення підрахувало, що приблизно 10 мільйонів людей були пропущені в його підрахунку 2010 року.


    Перепис 2010 року. Перше перерахування перепису 2010 року відбулося в Нурвік, штат Аляска. Ранній старт дозволяє учасникам перепису дістатися до віддалених сіл, перш ніж жителі підуть полювати та ловити рибу або подорожувати на роботу в теплу погоду після весняної відлиги. [13]

    Недолік не є випадковим, оскільки він більш поширений у певних районах та субпопуляціях. Тих, хто є бездомним або має нестабільне житло на момент перепису, часто пропускають. Тим, хто проживає у віддалених сільських районах, може бути важко зв'язатися поштою або особисто. Перепис також рідше отримує відповіді від тих, хто не довіряє уряду, наприклад, людей, які бояться, що їхні відповіді будуть використані імміграційними органами для депортації недокументованих членів сім'ї.

    Оскільки перепис проводиться лише кожні десять років, підрахунки мають довгострокові наслідки для штатів та міст. Точність підрахунку може бути дуже суперечливою в містах, пов'язаних з готівкою. Наприклад, Детройт оскаржив висновки перепису 2010 року, придумавши 40 000 людей, що не вистачає точки відсічення населення для багатьох основних джерел федерального фінансування. Оскільки бідне та маргіналізоване населення є одними з найважчих для підрахунку, райони з найбільшою потребою також найбільше ризикують недофінансування та недопредставленість.

    Окрім питань точності, хоча перепис та СКУД надають широкий набір соціальних даних, багато тем не охоплюються. Наприклад, немає питань щодо релігії, споживчих витрат або приналежності до політичних партій. Кількість і формулювання запитань, що задаються при переписі, змінювалися з плином часу, і дані не завжди доступні для всіх місць або для всіх географічних районів.

    Пам'ятайте, що існує багато інших соціальних опитувань, які збирають інформацію про різні атрибути, області або періоди. Наприклад, Асоціація статистиків американських релігійних органів проводить «Дослідження релігійних конгрегацій та членства» (RCMS) кожні 10 років для відстеження моделей релігійної приналежності. Органи місцевого самоврядування збирають дані для проектів у своєму конкретному регіоні. Існують також переписи, проведені в країнах по всьому світу з різним рівнем деталізації та точності.

    2.5 Поняття та проблеми даних

    Вибираючи дані для аналізу конкретної проблеми, слід пам'ятати про деякі ключові поняття: 1) роздільна здатність, 2) точність та 3) сумісність. Ми розглянемо кожне з цих понять щодо трьох елементів просторових даних (розташування, атрибути, час). Кожне з цих понять можна згорнути під терміном метадані в тому, що вони є інформацією про дані (або дані про дані). Розробка та розуміння метаданих передбачає перегляд основ «даних» з точки зору просторового розташування, виміряних атрибутів та зібраного часу.

    2.5.1 Роздільна здатність

    Постанова описує широту або специфіку даних, які ви досліджуєте. Існує три основних типи роздільної здатності — просторова, атрибутивна та тимчасова. Більш висока роздільна здатність відповідає меншим областям, за якими агрегуються дані, більш вузькими відмінностями між категоріями або коротшим часом між збором даних. Але перш ніж потрапити в приклади дозволу, пов'язаного з картографуванням соціальних даних, подумайте про концепцію стосовно повсякденних технологій.

    Просторова роздільна здатність. Ви, напевно, бачили термін «дозвіл», який використовується для опису якості екрану комп'ютера або камери мобільного телефону. Кожна картинка складається з безлічі менших квадратів або пікселів. Коли пікселі, що складають більшу картинку, невеликі, можна розрізнити більше деталей, а зображення, як кажуть, має більш високу роздільну здатність. Зі збільшенням розміру квадратних пікселів стає все складніше розгледіти дрібні деталі, такі як крапельки води на пелюстках квітки. Це може бути важливим, якщо ви копіюєте зображення з веб-сайту, а потім змінюєте розмір зображення. Залежно від роздільної здатності вихідного зображення, ви можете раптово побачити пікселі, які раніше були занадто малі, щоб побачити.


    Просторова роздільна здатність. Порівняння більшої роздільної здатності та меншої роздільної здатності на фотографії листя (зверху) або в сітці (знизу). [14]

    Просторова роздільна здатність також може посилатися на питання: «Яка найменша одиниця виміряної площі?» Це схоже на роздільну здатність пікселів, за винятком того, що карта часто не розділена на квадрати однакового розміру. Натомість карта може бути розділена між адміністративними кордонами (наприклад, переписними районами, округами або штатами), які мають різну форму та площі земель. Чим більше площа, по якій були агреговані дані, тим нижче роздільна здатність і тим складніше розібрати дрібні деталі в даних. На малюнку нижче невеликі ділянки з високою щільністю населення не видно з меншою просторовою роздільною здатністю.


    Дозвіл даних перепису. Порівняння даних про щільність населення, агрегованих за округами (ліворуч), з даними, агрегованими за переписом (праворуч). [15]

    Розглянемо приклад. Якби ви намагалися визначити, чи збільшувався середній дохід на вашому блоці за останні 4 роки, але єдиними даними, які ви могли знайти, була роздільна здатність на рівні поштового індексу, було б важко встановити закономірність. Поштові індекси значно більші за блоки. Зміни медіанного доходу в інших частині поштового індексу можуть затемнити або помилково покращити те, що відбувається у вашому блоці.

    Роздільна здатність атрибуції стосується ступеня, в якій проводяться відмінності між категоріями. Дані, розділені на багато категорій, забезпечують більш детальні відмінності і, отже, більш високу роздільну здатність атрибутів. Наприклад, уявіть, що вас цікавлять дані про вік осіб. Якщо дані згруповані лише у дві категорії - особи, яким не виповнилося 18 років, та особи старше 18 років - дані матимуть низьку роздільну здатність атрибутів. Для порівняння, поділ віку на більше категорій (наприклад, 0-18, 18-34, 34-64, 65+) дасть нам вищу роздільну здатність атрибуції. Якщо вам потрібно знати кількість осіб, які достатньо дорослі, щоб проголосувати на національних виборах, достатньо буде використовувати дані нижчої роздільної здатності. Але якщо вас цікавить кількість людей похилого віку, вам потрібно мати більш високу роздільну здатність даних.

    Тимчасова роздільна здатність - це частота, з якою збираються дані, і по суті вирішує питання, як часто або протягом якого періоду часу проводиться вимірювання? У розділі вище ми відзначили, що Бюро перепису населення США збирає дані кожні десять років, тоді як ACS проводить опитування щороку. Перепис є більш точним, ніж САУ, оскільки вона спирається на більшу частку населення, але ціною наявності більш грубого тимчасового дозволу. Не можна було б аргументувати, як ваш район змінився демографічно протягом п'яти років, враховуючи тимчасову роздільну здатність перепису, оскільки перепис дасть вам знімок вашого району лише кожні десять років.

    Підсумовуючи, дивлячись на дані, задайте собі наступні питання: Ви дивитеся на правильну область для питання, яке задається? Чи достатньо конкретні категорії даних для вашого аргументу (або вам потрібно розширити свої претензії)? Чи збираються дані досить часто за період часу, який ви хочете проаналізувати?

    2.5.2 Точність

    Точність описує, наскільки добре дані на карті вирівнюються з об'єктами у світі. Існує три основних типи точності — просторова, атрибутивна та тимчасова.

    Просторова точність відповідає на питання про те, наскільки добре розташування об'єкта на карті відповідає його розташуванню в світі. Є багато причин, чому місця розташування чогось на карті не зовсім відповідають тим, що на землі насправді. Межі між країнами можуть бути намальовані неправильно. Точки, позначені за допомогою GPS, можуть бути зміщені від їх фактичного місця розташування, якщо сигнал заблокований деревами або високими будівлями. На малюнку нижче показаний приклад людини, рухи якого відстежуються за допомогою GPS в транспортному засобі. Карта, здається, показує людину, яка проходить через кілька будівель, а потім біжить через дев'ятисмугову автостраду. Це здається лише таким чином на картах через помилку в тому, як були зібрані вимірювання GPS.


    Просторова точність. Синіми крапками позначають шлях, прийнятий особою, що несе пристрій стеження GPS в транспортному засобі. [16]

    Точність атрибутів запитує, чи відповідають характеристикам про об'єкт істинними щодо цього об'єкта у світі. Неточності атрибутів можуть відображатися в даних опитування, якщо учасники не відповідають, неправильно розуміють інструкції або цілеспрямовано надають неправдиву інформацію. Неточності також можуть виникати при оцінці значень для невеликої площі на основі невеликої кількості відповідей. Пам'ятайте, що ACS опитує близько 2% населення щороку - 4 з кожних 200 людей - а потім оцінює характеристики решти населення з їхніх відповідей. АСУ має кращий атрибут і тимчасову роздільну здатність, ніж перепис (більше категорій, які збираються частіше), але перепис більш точна в тому сенсі, що вона підраховує більше людей.

    Тимчасова точність стосується того, чи є деталі про об'єкт актуальними щодо змін у світі. Хоча дані можуть бути точними та повними під час їх збору, деталі незабаром можуть бути неточними через зміни соціального та фізичного ландшафту. Наприклад, об'єкти на друкованій довідковій карті з часом стануть менш точними, оскільки нові дороги будуються, видаляються або змінюються назви.


    Тимчасова точність. Статичні дорожні карти оновлюються набагато рідше, ніж карти Google. [17]

    2.5.3 Сумісність

    Сумісність описує, наскільки добре два різних набори даних працюють один з одним. Існує три основних типи сумісності — просторова, атрибутивна та тимчасова.

    Задайте собі такі питання: Чи порівнюють вони одну і ту ж область? Чи використовують вони одні й ті ж категорії і визначають їх однаково? Ці питання особливо актуальні при використанні даних, зібраних різними організаціями або протягом декількох періодів часу.

    Просторова сумісність. Наскільки добре збігаються просторові одиниці? Це питання, яке стосується просторової сумісності. Наприклад, поштові індекси та переписні ділянки - це просторові одиниці, для яких дані часто агрегуються, але їх межі рідко однакові. Перепис тракту може потрапляти в кілька поштових індексів і навпаки. Дані рівня поштового індексу та дані про рівень перепису тракту мають погану сумісність, оскільки вони не показують характеристик для однієї групи людей.


    Географії перепису. Географії перепису. Географічні райони, для яких Бюро перепису населення США надає доступні дані, починаючи від рівня штату і закінчуючи блоками. [18]

    Сумісність атрибутів задає питання: наскільки добре збігаються категорії двох наборів даних? Наприклад, під час перепису 2010 року люди могли вибирати між п'ятнадцятьма різними расовими категоріями з можливістю вибору декількох категорій. Для порівняння, в переписі 1850 року особини були розділені лише на три расові категорії: «білі», «чорні» або «мулатки». Ці два набори даних мають погану сумісність атрибутів, оскільки вони мають дуже різну роздільну здатність атрибутів і не мають відповідних категорій.


    Форма перепису 2010 року по перегонам. Під час перепису 2010 року люди могли вибирати між п'ятнадцятьма різними расовими категоріями з можливістю вибору декількох категорій. [19]

    Навіть категорія, яка має подібну назву між двома роками перепису, може вимірювати різні атрибути. Категорія «китайці», яка використовується в переписі 1870 року, застосовувалася до осіб з будь-якої частини Азії, а не тільки Китаю. Тому він не сумісний з «китайцями», як це було використано в переписі 2010 року.

    Тимчасова сумісність. Наскільки добре повідомлені часи збігаються? Тимчасова сумісність викликає найбільше занепокоєння, якщо ви робите аргумент про те, що таке речі в один момент часу, але ваші дані не з того ж моменту часу. Наприклад, уявіть, що ви працюєте в некомерційній організації, яка намагається порівняти кількість дітей віком 0-5 років з кількістю та місцем розташування центрів раннього дитинства в тій чи іншій області. Найточніший підрахунок дітей - з перепису 2010 року, але ваша організація має інформацію про дитячі центри, зібрані в 2015 році. Ці два набори даних мають погану тимчасову сумісність, оскільки жодні діти, які були 0-5 на момент перепису, все ще не перебували б у цій віковій групі в 2015 році. На основі цих даних було б важко визначити, чи належним чином розташовані дитячі центри. Нижче, іноді вам доводиться турбуватися як про просторову, так і про тимчасову сумісність!


    Просторова і тимчасова сумісність. Межі для різних років перепису населення в Південній Африці не вирівнюються між роками, оскільки з часом додавалися нові регіони. Одним з рішень є створення нової карти, яка групує регіони; ця інтегрована географія дозволяє порівнювати дані між картами. [20]

    Підводячи підсумок, розглядаючи кілька наборів даних, запитайте себе: чи є сенс порівнювати ці дані? Чи генеруються дані для однієї області з використанням однакових просторових одиниць? Чи визначені категорії атрибутів однаково організацією (організаціями), яка виробляла дані, і з часом? Чи були дані отримані протягом порівнянних часових рамок?

    2.6 Інструменти відображення

    Існує багато програмних програм для створення карт, і більшість пропонують цілий ряд даних своїм користувачам. Хоча ці програми традиційно були розроблені для настільних комп'ютерів, велика і зростаюча кількість веб-сайтів і веб-додатків дозволяють людям переглядати і робити карти онлайн. Ці карти та інструменти були розроблені з метою зробити дані більш доступними для дослідників, політиків та представників громадськості.

    Social Explorer є прикладом онлайн-картографічного інструменту, розробленого для полегшення доступу та використання даних, створених Бюро перепису населення США. Майте на увазі, що багато організацій зосереджені на отриманні карт в Інтернеті і не мали ніякої ролі у зборі базових даних. Натомість онлайн-карти та інструменти відображення діють як бібліотеки, об'єднуючи інформацію з декількох джерел. Зверніть увагу, що Social Explorer не є джерелом даних, що відображаються; це наш інструмент для вивчення даних, створених Бюро перепису населення.

    2.7 Висновок

    Щоразу, коли ви дивитеся на карту, важливо подумати про те, як були створені візуалізовані дані. Хто створив карту? Як збиралися основні дані? Які питання задавалися кому? Наскільки точна карта? Чого не вистачає? Навіть найбільш ретельно створені дані містять помилки та мають контекст у соціальному, політичному та культурному ландшафті. Щоб бути відповідальним користувачем карти та виробником карт, ви повинні думати про те, що ви можете і не можете показати, враховуючи роздільну здатність, точність та сумісність наявних даних. Важливо цитувати джерела даних, які ви включаєте на свою карту, щоб ваша аудиторія могла знайти додаткову інформацію.

    Коли ми переходимо до вивчення того, як символізувати та спростити дані, зробити привабливу карту та аналізувати просторові зв'язки даних, пам'ятайте: карта може бути лише такою ж хорошою, як дані, що входять до неї.

    Ресурси

    Для отримання додаткової інформації про історію перепису питань і процедур, а також про те, що перепис робить і не запитує:

    • Перепис населення США
    • Соціальний дослідник

    Для отримання додаткової інформації про GPS:

    • Географія університету штату Пенсільванія 482: Природа географічної інформації
    • Адам Ґеч у USC

    1. КУБ.СМ ПО-НК-СА 3.0. Адаптовано з Dibiase et al. (2012) Картування нашого мінливого світу. https://www.e-education.psu.edu/geog160/node/1930. Дженніфер Сміт, факультет географії, Університет штату Пенсільванія; Дані Бюро перепису населення США. ↑
    2. КУБ.СМ ПО-НК-СА 3.0. Адаптовано від Девіда Дібіаза (1998) Природа географічної інформації. https://www.e-education.psu.edu/natu...nfo/c5_p8.html; спочатку Ходжсон, C. V. вирівнюючий екіпаж на роботі в 1916 році. Колекція історичних фотографій NOAA (2004). Отримано 20 квітня 2006 року з http://www.photolib.noaa.gov/. ↑
    3. КУБ.СМ ПО-НК-СА 4.0. Адаптовано з Джей Кемпбелл і М.Шин (2012). https://2012books.lardbucket.org/boo...ics/index.html; ↑
    4. КУБ.СМ ПО-НК-СА 4.0. Адаптовано з Джей Кемпбелл та Шин (2012) https://2012books.lardbucket.org/boo...ics/index.html
    5. КУБ.СМ ПО-НК-СА 4.0. Адаптовано з Джей Кемпбелл та Шин (2012) https://2012books.lardbucket.org/boo...ics/index.html
    6. КУБ.СМ ПО-НК-СА 3.0. Адаптовано з Dibiase et al. (2012) Картування нашого мінливого світу. https://www.e-education.psu.edu/geog160/node/1941. Дані Бюро перепису населення США. ↑
    7. Громадське надбання. Національні центри екологічної інформації NOAA (nd) Вимірювальні прилади, що використовуються для поточних спостережень та звітності даних. www.ncdc.noaa.gov/data-acces... d-based-statio n-data
    8. КУБ.СМ ПО-НК-СА 3.0. Адаптовано з Девіда Дібіаза (1998). Природа географічної інформації. https://www.e-education.psu.edu/natu...nfo/c5_p8.html س
    9. Громадське надбання. За NASA/GSFC, MODIS швидкого реагування і demis.nl і FT2 - 1/Файл:Глибоководний горизонт розлив нафти - 24 травня, 2010.jpg (на основі оригінального зображення з обрізанням) 2/Локатор по FT2 з Файл:Карта США topological.png (Суспільне надбання автора demis.nl)., Суспільне надбання, https://commons.wikimedia.org/w/inde... курід=10671450. ↑
    10. КУБ.СМ ПО-НК-СА 3.0. Адаптовано від Девіда Дібіаза (1998) Природа географічної інформації https://www.e-education.psu.edu/natu...nfo/c5_p8.html. ↑
    11. Громадське надбання. Бюро перепису населення США. www.census.gov/історія/www/s... 790_photos.php㎡
    12. Громадське надбання. Бюро перепису населення США. https://broadcast.census.gov/pio/pho...0/1960a_hi.jpg س
    13. Громадське надбання. www.census.gov/історія/www/s... звуки/фото/ 2010_photos.php#
    14. Ліцензія на вільну документацію GNU, версія 1.2. Адаптовано з Саттона, О.Дассау, М.Саттон (2009). Ніжне введення в ГІС. Головний директорат: Просторове планування та інформація, Департамент земельних справ, Східний Кап. http://docs.qgis.org/2.14/en/docs/ge...ucing_gis.html س
    15. КУБ.СМ ПО-НК-СА 4.0. Стівен Менсон (2015) ↑
    16. КУБ.СМ ПО-НК-СА 4.0. Стівен Менсон (2015) ↑
    17. Відмовити ліцензію. https://unsplash.com/search/map?photo=gtCWBwbZNpM, Джон-Марк Кузнєцов
    18. Громадське надбання. Перепис населення США. http://factfinder.census.gov/faces/n...ges/using_fact finder.xhtml? page=переписі_географія ↑
    19. Громадське надбання. Веб-сайт Бюро перепису населення США - www.census.gov/prod/cen2010/b... c2010br-02.pdfă
    20. КУБ.СМ ПО-НК-СА 4.0. Адаптований з IPUMSI, створений Сулою Саркою та Дінг Фей. https://international.ipums.org/international/