1.3: Відносини
- Page ID
- 67505
Інша половина проектування мережевих даних пов'язана з тим, які зв'язки або відносини повинні бути виміряні для обраних вузлів. Тут слід обговорити два основні питання. У багатьох мережевих дослідженнях вивчаються всі зв'язки заданого типу між усіма вибраними вузлами — тобто проводиться перепис. Але, іноді використовуються різні підходи (тому що вони менш дорогі, або через необхідність узагальнення), що зразки зв'язків. Існує також другий вид вибірки зв'язків, який завжди відбувається в мережевих даних. Будь-який набір акторів може бути пов'язаний різними видами зв'язків і відносин (наприклад, студенти в класі можуть сподобатися або не любити один одного, вони можуть грати разом чи ні, вони можуть ділитися їжею чи ні тощо). Коли ми збираємо мережеві дані, ми зазвичай вибираємо або вибірку, з набору видів відносин, які ми могли б виміряти.
Зв'язки вибірки
З огляду на набір акторів або вузлів, існує кілька стратегій вирішення, як йти про збір вимірювань на відносини між ними. На одному кінці спектра підходів знаходяться «повні мережеві» методи. Цей підхід дає максимум інформації, але також може бути дорогим і складним у виконанні, і може бути важко узагальнити. На іншому кінці спектру знаходяться методи, які виглядають зовсім як ті, що використовуються в звичайних дослідженнях обстеження. Ці підходи дають значно менше інформації про структуру мережі, але часто є менш витратними і часто дозволяють легше узагальнити від спостережень у вибірці до деякої більшої кількості населення. Немає єдиного «правильного» методу для всіх дослідницьких питань і проблем.
Повні мережеві методи вимагають, щоб ми збирали інформацію про зв'язки кожного актора з усіма іншими акторами. По суті, такий підхід бере перепис зв'язків у популяції акторів, а не вибірку. Наприклад, ми могли б зібрати дані про поставки міді між усіма парами національних держав у світовій системі з записів Міжнародного валютного фонду; ми могли б вивчити ради директорів усіх державних корпорацій на предмет перекриття директорів; ми могли б підрахувати кількість транспортних засобів, що рухаються між усіма парами міста; ми могли б подивитися на потоки електронної пошти між усіма парами співробітників компанії; ми могли б попросити кожну дитину в ігровій групі ідентифікувати своїх друзів.
Оскільки ми збираємо інформацію про зв'язки між усіма парами або діадами, повні мережеві дані дають повну картину відносин у населення. Більшість спеціальних підходів і методів мережевого аналізу, які ми будемо обговорювати в решті цього тексту, були розроблені для використання з повноцінними мережевими даними. Повні мережеві дані необхідні для правильного визначення та вимірювання багатьох структурних концепцій мережевого аналізу (наприклад, між ними).
Повні мережеві дані дозволяють дуже потужно описувати та аналізувати соціальні структури. На жаль, повні мережеві дані також можуть бути дуже дорогими і важкими для збору. Отримання даних від кожного члена населення та наявність кожного члена рангу або оцінки кожного іншого члена може бути дуже складними завданнями в будь-яких, але найменших групах. Завдання стає більш керованим, попросивши респондентів визначити обмежену кількість конкретних осіб, з якими вони мають зв'язки. Потім ці списки можуть бути складені та перехресні зв'язані. Але, для великих груп (скажімо, всіх людей в місті) завдання практично нездійсненне.
У багатьох випадках проблеми не настільки серйозні, як можна собі уявити. Більшість осіб, груп та організацій, як правило, мають обмежену кількість зв'язків - або принаймні обмежену кількість міцних зв'язків. Ймовірно, це тому, що соціальні актори мають обмежені ресурси, енергію, час та пізнавальні здібності - і не можуть підтримувати велику кількість міцних зв'язків. Правда також, що соціальні структури можуть розвивати значну ступінь порядку та солідарності з відносно невеликою кількістю зв'язків.
Методи сніжок починаються з фокусного актора або набору акторів. Кожному з цих акторів пропонується назвати деякі або всі свої зв'язки з іншими акторами. Потім всі названі актори (які не були частиною оригінального списку) вистежуються і просять про деякі або всі їхні зв'язки. Процес триває до тих пір, поки не буде виявлено нових акторів, або поки ми не вирішимо зупинитися (як правило, з міркувань часу та ресурсів, або тому, що нові актори, які називаються, дуже маргінальні для групи, яку ми намагаємось вивчити).
Метод сніжної кулі може бути особливо корисним для відстеження «особливих» популяцій (часто чисельно малих підмножин людей, змішаних з велика кількість інших). Ділові контактні мережі, еліти громад, девіантні субкультури, завзяті колекціонери марок, мережі спорідненості та багато інших структур можуть бути досить ефективно розташовані та описані методами сніжної кулі. Домогтися закриття в снігових «зразках» часом не так складно, як можна було б подумати. Обмеження кількості міцних зв'язків, які мають більшість акторів, і тенденція до взаємністю зв'язків часто дозволяють досить легко знайти межі.
Існують два основні потенційні обмеження та слабкі сторони методів сніжної кулі. По-перше, дійові особи, які не пов'язані (тобто «ізолює»), не розташовані цим методом. Наявність і кількість ізолятів може бути дуже важливою особливістю популяцій для деяких аналітичних цілей. Метод сніжної кулі може, як правило, завищувати «зв'язність» та «солідарність» популяцій акторів. По-друге, немає гарантованого способу знаходження всіх пов'язаних особин в популяції. З чого починається катання сніжок? Якщо ми почнемо в неправильному місці чи місцях, ми можемо пропустити цілі підмножини акторів, які пов'язані - але не прив'язані до наших вихідних точок.
Підходи Snowball можна посилити, давши деяку думку про те, як вибрати початкові вузли. У багатьох дослідженнях може бути природна відправна точка. Наприклад, у дослідженнях влади громади прийнято починати пошуки сніжної кулі з керівниками великих економічних, культурних та політичних організацій. Хоча такий підхід буде пропустити більшу частину спільноти (тих, хто «ізольований» від елітної мережі), підхід з великою ймовірністю захопить елітну мережу досить ефективно.
Егоцентричні мережі (з альтернативними зв'язками)
У багатьох випадках не вдасться (або потрібно) відстежити повні мережі, починаючи з фокальних вузлів (як у методі сніжної кулі). Альтернативний підхід полягає в тому, щоб почати з вибору фокальних вузлів (его) та визначити вузли, до яких вони підключені. Потім визначаємо, які з виявлених на першому етапі вузлів з'єднуються один з одним. Це можна зробити, зв'язавшись з кожним з вузлів; іноді ми можемо попросити его повідомити, які з вузлів, до яких він прив'язаний, прив'язані один до одного.
Такий підхід може бути досить ефективним для збору форми реляційних даних з дуже великих популяцій, і може поєднуватися з підходи, засновані на атрибутах. Наприклад, ми можемо взяти простий випадковий зразок студентів-чоловіків і попросити їх повідомити, хто є їхніми близькими друзями, і хто з цих друзів знає один одного. Такий підхід може дати нам хорошу та надійну картину видів мереж (або принаймні місцевих кварталів), в які вбудовані особи. Ми можемо з'ясувати такі речі, як скільки зв'язків мають вузли, і наскільки ці вузли є згуртованими групами. Такі дані можуть бути дуже корисними, допомагаючи зрозуміти можливості та обмеження, які его має внаслідок того, як вони вбудовуються у свої мережі.
Его-орієнтований підхід із зміненими зв'язками також може дати нам деяку інформацію про мережу в цілому, хоча і не стільки, скільки сніжний ком або підходи перепису. Такі дані є, по суті, мікромережевими наборами даних — вибірками локальних областей великих мереж. Багато властивостей мережі - відстань, центральність та різні види позиційної еквівалентності не можуть бути оцінені за допомогою егоцентричних даних. Деякі властивості, такі як загальна щільність мережі, можна розумно оцінити за допомогою егоцентричних даних. Деякі властивості — такі як поширеність взаємних зв'язків, клік тощо, можна оцінити досить безпосередньо.
Егоцентричні мережі (лише его)
Его-орієнтовані методи дійсно орієнтуються на індивіда, а не на мережі в цілому. Збираючи інформацію про зв'язки між акторами, пов'язаними з кожним фокусним его, ми все ще можемо отримати досить гарну картину «місцевих» мереж або «кварталів» окремих осіб. Така інформація корисна для розуміння того, як мережі впливають на окремих осіб, а також вони дають (неповну) картину загальної текстури мережі в цілому.
Припустимо, однак, що ми отримали інформацію лише про зв'язки его з альтерами - але не інформацію про зв'язки між цими змінами. Подібні дані взагалі не є «мережевими» даними. Тобто вони не можуть бути представлені у вигляді квадратного масиву зв'язків за актором. Але це не означає, що егоцентричні дані без зв'язків між альтерами не мають ніякої цінності для аналітиків, які прагнуть взяти структурний або мережевий підхід до розуміння акторів. Ми можемо знати, наприклад, що деякі актори мають багато близьких друзів і родичів, а у інших мало. Знаючи це, ми можемо зрозуміти дещо про відмінності акторів місць у соціальній структурі, і зробити деякі прогнози про те, як ці локації стримують їх поведінку. Те, що ми не можемо знати з его-центричних даних з певністю, - це природа макроструктури або всієї мережі.
У его-центричних мережах зміни, визначені як пов'язані з кожним его, ймовірно, є набором, який не пов'язаний з тими, що один для одного его. Хоча ми не можемо оцінити загальну щільність або зв'язність населення, ми іноді можемо бути трохи більш загальними. Якщо у нас є вагомі теоретичні підстави думати про зміни з точки зору їх соціальних ролей, а не як окремих мешканців соціальних ролей, его-орієнтовані мережі можуть розповісти нам трохи про місцеві соціальні структури. Наприклад, якщо ми ідентифікуємо кожну з змін, пов'язаних з его дружбою стосунками, як «рід», «колега», «член тієї ж церкви» тощо, ми можемо створити картину мереж соціальних позицій (а не мереж людей), в які вбудовані его. Такий підхід, безумовно, передбачає, що такі категорії, як «родичі», є реальними і значущими детермінантами закономірностей взаємодії.
Множинні відносини
У звичайному наборі даних за ознакою кожен актор описується багатьма змінними (і кожна змінна реалізується у багатьох акторів). У найпоширенішому наборі даних соціальної мережі акторських зв'язків описується лише один вид відносин. Подібно до того, як нас часто цікавлять численні атрибути акторів, нас часто цікавлять різні види зв'язків, які з'єднують акторів у мережі.
Роздумуючи про мережеві зв'язки між викладачами в академічному відділі, наприклад, нас може зацікавити, на якому факультеті є студенти спільні, служать в одних і тих же комітетах, взаємодіють як друзі поза робочим місцем, мають одну або кілька спільних областей експертизи та співавтор статей. Позиції, які займають актори в мережі групової приналежності, багатогранні. Позиції в одній сукупності відносин можуть знову виконувати або суперечити позиціям в іншому (я міг би розділити дружбу з одним набором людей, з якими я не працюю в комітетах, наприклад). Актори можуть бути тісно пов'язані між собою в одній реляційній мережі, але бути досить віддаленими один від одного в іншій реляційній мережі. Розташування акторів у багатореляційних мережах та структура мереж, що складаються з безлічі відносин, є одними з найцікавіших (і досі відносно невивчених) областей аналізу соціальних мереж.
Коли ми збираємо дані соціальних мереж про певні види відносин між суб'єктами, ми, в певному сенсі, вибірка з населення можливих відносини. Зазвичай наше дослідницьке питання та теорія вказують, які з видів відносин між суб'єктами є найбільш актуальними для нашого дослідження, і ми не вибірковуємо — а відбираємо — відносини. Наприклад, у дослідженні, пов'язаному з економічною залежністю та зростанням, я міг би зібрати дані про обмін виступами музикантів між країнами - але це, швидше за все, не буде настільки актуальним.
Якщо ми не знаємо, які відносини вивчити, як ми можемо вирішити? Існує ряд концептуальних підходів, які можуть бути корисні. Теорія систем, наприклад, передбачає дві області: матеріальну та інформаційну. Матеріальні речі «консервуються» в тому сенсі, що вони можуть розташовуватися тільки на одному вузлі мережі одночасно. Переміщення людей між організаціями, гроші між людьми, автомобілі між містами тощо - все це приклади матеріальних речей, які рухаються між вузлами, а отже, створюють мережу матеріальних відносин. Інформаційні речі, на думку системного теоретика, є «неконсервованими» в тому сенсі, що вони можуть знаходитися в декількох місцях одночасно. Якщо я щось знаю і поділюся цим з вами, ми обидва тепер це знаємо. У певному сенсі спільність, яку поділяє обмін інформацією, також може бути сказано, що встановлює зв'язок між двома вузлами. Однак тут потрібно бути обережним, щоб не плутати просте володіння загальним атрибутом (наприклад, стать) з наявністю краватки (наприклад, обмін думками між двома особами з гендерних питань).
Методології роботи з мультиреляційними даними розвинені не так добре, як ті, що працюють з одиночними відносинами. Для роботи з багатореляційними даними було розроблено багато цікавих напрямків роботи, таких як мережева кореляція, багатовимірне масштабування та кластеризація, а також рольові алгебри. Здебільшого ці теми виходять за рамки поточного тексту, і найкраще підходити після освоєння основ роботи з єдиними реляційними мережами. Ми розглянемо деякі методи мультиреляційних (так звані «мультиплексні» мережеві дані в розділі 16).