5: Популяційна генетика розбіжності та молекулярної заміщення

Last updated
Save as PDF

Page ID: 7811

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

«Історія - це лише одна чортова річ за іншою». -іноді приписують Арнольду Тойнбі

Існує понад\(30\) мільйон базових парних замін між людиною та шимпанзе, сайти, де люди несуть один алель, а шимпанзе інший в ортологічних місцях. Ці зміни відбулися протягом семи мільйонів років або близько того, як людина і шимпанзе востаннє ділили спільного предка. Інші заміни поділяються між сестринських видів людини і шимпанзе до виключення горили, але інші поділяються між людиною, шимпанзе і горили, але не Orangs. Довгострокова еволюція, з молекулярної точки зору, є лише однією проклятою заміною за іншою. Ці заміни представляють собою зміни лише на невеликому відсотку ділянок у всьому геномі, оскільки ми поділяємо більшість нашого геному, нашу еволюційну історію та нашу біологію з іншими великими мавпами. Кожна з замін повинна виникати як мутація в популяції, поширилася по популяції як поліморфізм, перш ніж врешті-решт досягти фіксації. Які сили змусили поширення цих алелів по населенню стати замінниками?

Людський	`акка cag кішка тгтттта тттга такт gcca ага кттг тг тг тг тг тг тг тг тг тг тг`
Шимпанзе	`... г... c...`
Горили	`... куб...`
Орангутанг	`... c... c... c...`
Гібон	`... c... —...`
Макака, що їсть крабів	`г... gg... c... c.. t.t...`

Багато замін були обумовлені селекцією, оскільки, безсумнівно, було багато адаптивної фенотипічної адаптивної еволюції у великих мавп. Однак ці адаптивні зміни можуть бути невеликою меншістю всіх замін, для початку багато з цих замін відбулися в некодуючої ДНК без відомого функціонального ефекту. Таким чином, розумною є вихідна позиція, що більшість замін в масштабі генома цілком можуть бути нейтральними. Як ми можемо сподіватися визначити регіони, які зазнають адаптивної дивергенції? Як ми могли сподіватися вирішити твердження про те, що багато замінників, що змінюють амінокислоти, також є нейтральними, як стверджує Нейтральна теорія молекулярної еволюції. Один із шляхів вперед полягає в тому, щоб зрозуміти, що нейтральна теорія передбачає швидкість молекулярної заміни, а потім розробити способи перевірки цих ідей.

Ілюстрація Бенджаміна Уотерхауса Хокінса з «Свідчення про місце людини в природі» (1863). Зображення з Вікімедіа, суспільне надбання.

Процес нейтральної заміни.

Так як же тоді відбуваються нейтральні заміни? Дуже малоймовірно, що рідкісний нейтральний алель випадково дрейфує до фіксації, швидше за все, такий алель з часом буде втрачений у популяції. Однак популяції відчувають великий і постійний приплив рідкісних алелів через мутацію, тому навіть якщо дуже малоймовірно, що окремий алель фіксується всередині популяції, деякі нейтральні алелі виправляться випадково. Тому нам потрібно зрозуміти ймовірність того, що нейтральна мутація фіксується, а потім, як ми можемо думати про швидкість замін накопичується з часом.

ймовірність можливої фіксації нейтрального алеля

Кожен алель, спочатку присутній у невеликій диплоїдній популяції, має різний колір, щоб ми могли відстежувати їх нащадків з часом. До 9-го покоління всі алелі, присутні в популяції, можуть простежити своє походження до помаранчевого алеля.

Алель, який досягає фіксації всередині популяції, є родоначальником всієї популяції. У певному поколінні може бути лише один алель, який усі інші алелі в локусі більш пізнього покоління можуть претендувати як предок (див. Рис.\ ref {fig:subs_simulation}). У нейтральному локусі фактичний алель не впливає на кількість нащадків, які має алель (це випливає з визначення нейтральності: нейтральні алелі не залишають в середньому більш-менш нащадків, ніж інші нейтральні алелі). Еквівалентний спосіб заявити про це полягає в тому, що етикетки алелів нічого не впливають; таким чином, алелі обмінні. Як наслідок обміну, будь-який алель однаково ймовірно буде предком всієї популяції. У диплоїдної популяції розміром\(N\) є\(2N\) алелі, всі з яких однаково ймовірно будуть родоначальником всієї популяції в якийсь більш пізній момент часу. Отже, якщо наш алель присутній в єдиному екземплярі, шанс, що він є предком всієї популяції в якомусь майбутньому поколінні\(\frac{1}{(2N)}\), є, тобто шанс, що наш нейтральний алель врешті-решт фіксується, є\(\frac{1}{(2N)}\). На рисунку\ ref {fig:subs_simulation} наш помаранчевий алель у першому поколінні є одним з 10 алелів різного кольору, і тому має\(1/10\) шанс бути родоначальником всієї популяції в якийсь більш пізній момент часу (і в цьому моделюванні він стає спільним предком, до 9-го покоління).

Більш загально, якщо наш нейтральний алель присутній в\(i\) копіях в популяції,\(2N\) алелів, ймовірність того, що цей алель стане фіксованим\(\frac{i}{(2N)}\), тобто ймовірність того, що нейтральний алель врешті-решт фіксується, просто задається його частотою ( \(p\)) в популяції. (Ми також можемо отримати цей результат,\(Ns \rightarrow 0\) ввівши Equation\ ref {eqn:prob_fixed}, результат, з яким ми зіткнемося пізніше.)

Скільки часу потрібно в середньому, щоб такий алель закріпився в нашому населенні? При розробці Equation\ ref {tMRCA_neutral} ми бачили, що для великого зразка алелів потрібно в середньому\(4N\) поколінь, щоб простежити їх походження назад до одного найновішого загального родового алеля. Будь-яка однобазова пара зміна, яка виникла як одна мутація в локусі та зафіксована в популяції, повинна бути присутня в послідовності, переданої останнім загальним предком популяції в цьому місці. Таким чином, для фіксації нейтрального алеля, присутнього в одному екземплярі в популяції, повинно знадобитися приблизно\(4N\) покоління. Цей аргумент можна зробити більш точним, але загалом ми все одно виявимо, що нейтральний алель потребує\(\approx 4N\) поколінь, щоб перейти від його введення до фіксації з населенням.

Швидкість заміщення нейтральних алелів

Заміна між популяціями, які не обмінюються потоком генів, - це просто подія фіксації в межах однієї популяції. Таким чином, швидкість заміщення - це швидкість, з якою нові алелі фіксуються в популяції, так що довгостроковий коефіцієнт заміщення - це швидкість, з якою виникають мутації, які в кінцевому підсумку закріпляться в нашому населенні.

Давайте припустимо, виходячи з нашого обговорення нейтральної теорії молекулярної еволюції, що існує лише два класи мутаційних змін, які можуть відбуватися з областю, дуже згубними мутаціями та нейтральними мутаціями. Частка\(C\) всіх мутаційних змін є дуже згубними і не може сприяти заміщенню або поліморфізму. Інша\(1-C\) частка мутацій нейтральна. Якщо наша загальна швидкість мутації припадає\(\mu\) на передається алель на покоління, то загальна кількість\(2N \mu (1-C)\) нейтральних мутацій надходить у нашу популяцію кожного покоління.

Кожна з цих нейтральних мутацій має\(\frac{1}{(2N)}\) ймовірність в кінцевому підсумку закріпитися в популяції. Тому швидкість, з якою виникають нейтральні мутації, які з часом фіксуються всередині нашого населення, становить

\[2N\mu(1-C)\frac{1}{2N} = \mu(1-C)\]

Таким чином, швидкість заміщення, за моделлю, де знову виникають алелі є або дуже згубними, або нейтральними, просто задається швидкістю мутації нейтральних алелів, тобто\(\mu(1-C)\).

Розглянемо пару видів, які розходилися протягом\(T\) поколінь, тобто ортологічні послідовності, поділені між видами, які останні поділяли спільного предка\(T\) поколінь тому. Якщо ці види підтримували постійну\(\mu\) протягом цього часу, вони накопичаться в середньому

\[2\mu(1-C)T \label{eqn:moleclock}\]

нейтральні заміни. Це передбачає, що\(T\) це набагато довше, ніж час, необхідний для фіксації нейтрального алеля, таким чином, що загальна кількість алелів, що вводяться в популяції, які в кінцевому підсумку зафіксують, - це загальна кількість замін.

Це дійсно гарний результат, оскільки чисельність населення повністю скасувалася з нейтрального рівня заміщення. Однак є й інший спосіб побачити це більш прямо вперед. Якщо я дивлюся на послідовність в мені порівняно, скажімо, з певним шимпанзе, я дивлюся на мутації, які відбулися в обох наших зародкових лініях, оскільки вони розлучилися\(T\) поколіннями тому. Оскільки нейтральні алелі не змінюють ймовірність їх передачі наступному поколінню, ми просто дивимося на мутації, які відбулися в\(2T\) поколіннях вартістю передач. Таким чином, середня кількість нейтральних мутаційних відмінностей, що розділяють нашу пару видів, просто\(2\mu (1-C) T\).

Наслідки для молекулярного годинника.

За цією моделлю слідує низка спостережень з Equation\ ref {eqn:moleclock}. Перший полягає в тому, що основним детермінантом закономірностей молекулярної еволюції в геномній області є рівень обмеження (\(C\)). Ця модель, як правило, тримається емпірично: некодуючі регіони часто розвиваються швидше, ніж регіони кодування, синонімічні заміни накопичуються швидше, ніж несинонімічні, а несинонімічні заміни накопичуються швидше в менш життєво важливих білках, ніж ті, які абсолютно необхідні для раннього розвитку. Наприклад, фібринопептиди розвиваються менш обмеженим чином, ніж ген цитохрому c, див. Рис.\ ref {рис:Dickerson_mole_clock}. Зауважте, що це прогнозування обмежень не є унікальним прогнозом нейтральної моделі, наприклад, менш обмежені області також можуть краще розвиватися адаптивно. Однак це фантастично корисне загальне уявлення, наприклад, дозволяє нам визначити передбачувано функціональні некодуючі регіони, шукаючи геномні регіони, які мають дуже низький рівень розбіжності між віддалено спорідненими видами.

Другим важливим розумінням і критичним для розвитку нейтральної теорії є те, що Equation\ ref {eqn:moleclock}, здавалося б, відповідає гіпотезі про дивно постійний білковий молекулярний годинник. Молекулярний годинник білка - це спостереження, що для деяких білків існує лінійна залежність між кількістю несинонімічних (NS) заміщень та часовими видами останнього спільного предка у викопному записі. за умови раннього прикладу цього спостереження (Рисунок\ ref {рис:Dickerson_mole_ clock}), шляхом порівняння різних організмів, молекулярні послідовності яких були йому доступні. Наприклад, він виявив, що люди та гримучі змії, які в останній раз мають спільного предка у викопному записі близько 300 мільйонів років, розділені приблизно\(15\) NS-заміщеннями на\(100\) ділянки в білку цитохрому c. У той час як люди та собачі риби, які розійшлися близько 400 мільйонів років, розділені заміщеннями\(19\) NS на\(100\) ділянки цього гена.

зображення

У Equation\ ref {eqn:moleclock}, якщо подвоїти кількість часу, що розділяє пару видів\(T\), ми подвоїмо кількість передбачуваних підстав. Зверніть увагу, що для того, щоб це було правдою,\(T\) необхідно вимірювати поколіннями. Щоб пояснити молекулярний годинник білка між видами, які явно різко відрізнялися в часі покоління, було висунуто гіпотезу, що швидкість мутації насправді масштабується з часом генерації, тобто короткочасні організми ввели менше мутацій на покоління, наприклад, оскільки вони мали менше раундів мітозу. Це припущення часу покоління означало, що швидкість мутації на рік може бути постійною, такою, що\(\mu T\) буде постійною для пар видів, які розходилися за подібні геологічні часи, які вимірюються роками, навіть якщо організми відрізнялися часом покоління. Це припущення дозволило б нейтральної теорії узгоджуватися з білковим молекулярним годинником, виміряним роками. Тепер ми знаємо, що це критичне припущення про час генерації помилкове: організми з коротшим часом генерації мають дещо вищі показники мутації на рік, тому сувора нейтральна модель не відповідає молекулярному годиннику білка. Ми повернемося до цих ідей, коли обговоримо долю дуже слабо відібраних мутацій у розділі\ ref {Selection_Stochasticity} і майже нейтральної теорії. Якщо ви все ще читаєте це, надішліть Грему фотографію Томоко Охта, яка отримує премію Crafoord, аналог Нобелівської премії з біології, за її внесок у молекулярну еволюцію.

Внесок родового поліморфізму в дивергенцію.

Якщо ми розглядаємо\(T\) можливість представляти розбіжність між давно відокремленими видами, то ми можемо думати про час, коли вид розколюється.\(T\) Однак для зовсім недавно розійшлися популяцій і видів потрібно включити той факт, що сортування родового поліморфізму сприяє розбіжності між видами. На малюнку\ ref {fig:split_anc_pop} ми бачимо, як наші дві популяції розділені\(T_s\) покоління тому. Однак коалесценція нашої лінії A і B обов'язково глибше в часі, ніж\(T_s\). Верхня мутація була поліморфною в родовій популяції, але тепер сприяє розбіжності між А і Б. Якщо припустити, що наша родова популяція мала ефективних розмірів\(N_A\) особин, і що наші популяції розщеплюються чисто без подальшого потоку генів, то

\[T = T_s + 2N_A.\]

Якщо наш вид розділений час дуже великий в порівнянні з\(2N\) тоді ми можемо думати про\(T\) розділений час.

[фіг:спліт_анк_поп]

Вправа\(\PageIndex{1}\)

Для цього, і наступне питання, припустимо, що люди і шимпанзе розкололися близько 5,5\(\times 10^6\) років тому, мають час покоління 20 років, що видоутворення відбулося миттєво в алопатрії без подальшого потоку генів, і родової ефективної чисельності популяції людини і шимпанзе загальні популяція предків становила 10 000 особин.

Нахман і Кроуелл секвенували 12 псевдогенів у людей і шимпанзе і знайшли заміни на 1,3% ділянок.

Яка швидкість мутації на ділянку на покоління у цих генів?
Всі псевдогени, які вони секвенували, знаходяться на аутосомах. Яким буде ваш прогноз для псевдогенів на X і Y-хромосомах, враховуючи, що в жіночій зародковій лінії відбувається мало мутацій, ніж у чоловічої зародкової лінії на покоління.

Тести молекулярної еволюції

Одним із чудових звернень нейтральних моделей є те, що вони пропонують нам простий нуль для тестування реальних даних.

Порівняння ставок несинонімічних замін з синонімічними замінниками\(\frac{d_N}{d_S}\)

Одним із поширених інструментів молекулярної еволюції є порівняння розрахункової кількості (або швидкості) заміщень у різних класах геномних сайтів, наприклад співвідношення швидкостей несинонімічних (\(d_N\)) до синонімічних замін (\(d_S\)) у даному гені. Найпростіший спосіб подумати про обчислення\(d_N\) - підрахувати несинонімічні зміни і розділити на загальну кількість позицій в гені, де може статися несинонімічна точка мутації, а потім розділити на час. Ми можемо зробити так само для\(d_S\) синонімічних змін, а потім взяти співвідношення\(\frac{d_N}{d_S}\).

Для переважної більшості генів, що кодують білок, в геномі ми бачимо це\(\frac{d_N}{d_S} < 1\). Це спостереження узгоджується з думкою, що несинонімічні сайти набагато більш обмежені, ніж синонімічні сайти, тобто що більшість несинонімічних мутацій є згубними і швидко видаляються з населення. Якщо ми готові зробити припущення, що всі синонімічні зміни нейтральні\(d_S= \mu\), то можна оцінити ступінь обмеженості на несинонімічних сайтах. (Зауважте, що синонімічні зміни іноді можуть піддаватися як позитивному, так і негативному відбору, але це нейтральне припущення є корисним відправним місцем.)

Припустимо, що\(C\) частка несинонімічних змін занадто згубна, щоб сприяти розбіжності, і що корисних мутацій немає. Тоді ми очікували, що швидкість нейтральних несинонімічних замін

\[d_N = (1-C) \mu\]

Розділивши на\(d_S\), знаходимо

\[\frac{d_N}{d_S} = (1-C)\]

Тому, якщо припустити, що несинонімічні мутації можуть бути лише сильно згубними або нейтральними, ми оцінюємо частку мутаційних змін, які стримуються негативним відбором, як\(C= 1- \frac{d_N}{d_S}\). C має інтерпретації того, що це частка несинонімічних мутацій, які швидко висіваються з популяції селекцією, і тому не сприяють розбіжності між видами.

Ми можемо перевірити, чи наш ген розвивається обмеженим чином на рівні білка, оцінюючи\(\frac{d_N}{d_S}\) та перевіряючи, чи це значно менше\(1\). \(\frac{d_N}{d_S}\)Тест може надати еволюційні докази того, що розтяжка ДНК, запропонована для кодування білка, підлягає селективному обмеженню, і тому, ймовірно, кодує функціональний білок. Ми також можемо провести\(\frac{d_N}{d_S}\) тест на конкретних гілках філогенезу для гена, перевірити, на яких гілках ген піддається обмеженню, або перевірити на наявність змін рівня обмеження по всій філогенії.

Втрата обмеженості при псевдогенах.

Хоча більшість білкових генів розвиваються в обмеженому стані, ми можемо знайти приклади генів, які еволюціонують набагато менш обмеженим чином. Найпростішим прикладом цього є те, де ген втратив функцію. Гени можуть втратити функцію через інактивацію мутацій, які зупиняють їх транскрибування або перетворення на функціональні білки. Такі гени називаються «псевдогенами». Коли ген повністю втрачає функцію, більше не відбувається виділення проти несинонівних змін, і тому такі мутації так само вільно накопичуються, як синонімічні зміни тощо\(\frac{d_N}{d_S}=1\). Псевдогени є чудовим прикладом розширення уявлень Дарвіна про рудиментарні риси («Рудиментарні органи») до рівня ДНК; ми все ще можемо розпізнати колись корисне слово (ген), правопис якого повільно деградує. Наші геноми наповнені старими псевдогенами, початкові значення яких (функціональні послідовності кодування білка) повільно розмиваються через накопичення нейтральних замін. Одним з приємних прикладів гена, який неодноразово втрачав функцію, тобто став багаторазово псуедогенізованим, є ген емаліну з дослідження.

[Рис.: Емалін_кодування]

зображення

Білок емалін є ключовим структурним білком, який бере участь у зовнішній ковпачок емалі на зубах. Різні ссавці вдруге розвивалися дієти, які не вимагають твердих зубів, і так сильно знизили тиск відбору для твердої емалі або навіть зубів взагалі. Наприклад, двопалі лінивці (Choloepus), карликові кашалоти (Kogia) і аардварк (Orycteropus) все позбавлені емалі на зубах. Інші ссавці повністю втратили зуби, наприклад, гігантські мурахоїди (Myrmecophaga) та вусаті кити. Завдяки цьому розслабленню обмеження на фенотип, ген емаліну накопичив псевдогенізуючі заміни, такі як передчасні стоп-кодони та мутації зрушення кадрів (див. Рис.\ ref {Fig:Enamlin_coding} для прикладів). секвенований емалін через a Асортимент видів і виявив, що жоден з видів з емаллю не має мутацій зрушення кадру в емаліні, тоді як 17/20 видів, які не мають емалі або зубів, мають зрушення кадрів в емаліні, і всі вони несуть передчасні стоп-кодони.

встановлено, що гілки філогенії емаліну з функціональним геном емаліну мали оцінку\(\frac{d_N}{d_S}= 0.51\), узгоджену з білком, що розвивається стриманим чином. На відміну від цього, гілки з псевдогенізованим Емаліном мали\(\frac{d_N}{d_S} = 1.02\), узгоджені з геном, що розвиваються абсолютно невимушеним чином. Гілки, де ген, ймовірно, переходив з функціонального стану в нефункціональний, тобто премутаційний і змішаний, мали проміжні значення\(\frac{d_N}{d_S}=0.83-0.98\), узгоджені з переходом від обмеженого до невимушеного режиму еволюції білка десь уздовж цих гілок філогенезу .

Синтетична інтерпретація історії дегенерації емалі в Tubulidentata (порядок аардварків) на основі скам'янілостей, філогенетики, молекулярних годинників, мутацій зрушення кадрів та співвідношення\ frac {d_n} {d_s}. Найстаріші викопні аардварки - це O. minutus (19 травня) з раннього міоцену Кенії, а також не вистачає емалі. Малюнок & підпис змінено з,. — Синтетична інтерпретація історії дегенерації емалі в *Tubulidentata* (порядок аардварків) на основі скам'янілостей, філогенетики, молекулярних годин, мутацій зрушення кадрів та\(\frac{d_N}{d_S}\) співвідношення. Найстаріші викопні аардварки - це *O. minutus* (19 травня) з раннього міоцену Кенії, а також не вистачає емалі. Малюнок & підпис змінено з,.

[Рис: Аардварк_псевдоген]

зображення

Вправа\(\PageIndex{2}\)

Ген емаліну був псевдогенізований десь уздовж гілки, що веде до Aardvarks (Orycteropus afer), див. Рисунок\ ref {fig:aardvark_pseudogene}. За оцінками, ця гілка має\(\frac{d_N}{d_S}=0.75\)

Обчисліть середнє обмеження проти амінокислотних змін на цій гілці.
Останній Аардварк поділив спільного предка з Afrosoricida (золоті родимки, тенреки) і Macroscelidea (слонові землерийки) близько\(\sim 75.1\) мільйона років тому в крейдяному. Припустимо, що для частини гілки, поки емалін був функціональним,\(\frac{d_N}{d_S} = 0.51\) і після його псевдогенізації не було константа (тобто\(\frac{d_N}{d_S} = 1\)). Виходячи з середнього показника гілки\(\frac{d_N}{d_S}=0.75\), чи можете ви оцінити час, коли емалін був псевдогенізований? (Тобто коли зірка на малюнку\ ref {fig:aardvark_pseudogene}?)

Адаптивна еволюція і\(\frac{d_N}{d_S}\)

Очевидно, гени не тільки схильні до нейтральних і згубних мутацій; корисні мутації також повинні час від часу виникати і фіксуватися. Припустимо, що\(B\) частка несинонімічних мутацій, що виникають, є корисними такими, що\(2 N \mu B\) корисні мутації виникають на покоління. Нещодавно виниклі корисні алелі не призначені для фіксації в популяції, оскільки вони можуть бути втрачені до генетичного дрейфу, коли вони рідкісні в популяції (ми обговоримо, як обчислити ймовірність фіксації корисних алелів у розділі\ ref {Selection_Stochasticity}). Нещодавно виник корисний алель досягає фіксації в популяції з ймовірністю\(f_B\) від його початкової частоти\(\frac{1}{2N}\). Така ймовірність фіксації може бути набагато вище, ніж у нейтральних мутацій, але все ж набагато менше\(1\). Очікувана загальна норма несинонімічних замін

\[dN= (1-C - B) \mu + (2 N \mu B) \times f_B.\]

Тоді

\[\frac{d_N}{d_S} = (1-C-B) + 2 N B f_B \label{eqn:dNDS_C_B}\]

знову припускаючи, що всі синонімічні мутації нейтральні. Зауважте, що це означає, що наші оцінки\(C\) використання\(1-\frac{d_N}{d_S}\) будуть нижчою межею істинного обмеження, якщо навіть невелика частина мутацій буде корисною. Ті випадки, коли ген розвивається швидше на рівні білка, ніж на синонімічних ділянках\(d_N/d_S > 1\), тобто є потенційно сильними кандидатами на позитивний відбір, що швидко рухає змінами на рівні білка. Ми можемо ідентифікувати гени, які мають\(\frac{d_N}{d_S}\) значно більше одного, або на повному генному філогені, або на окремих гілках. Зауважте, що це дуже консервативний тест, який мало генів у геномі зустрічається, оскільки багато генів, які фіксують адаптивні несинонімічні заміни\(\frac{d_N}{d_S}<1\); навіть якщо адаптивні мутації є загальними, гени все одно можуть розвиватися обмежено (тобто\(\frac{d_N}{d_S}<1\)), якщо швидка фіксація корисних мутацій внаслідок позитивного відбору переважується втратою несинонімічних мутацій до негативного відбору.

зображення

Класичним прикладом розгляду адаптивної еволюції\(\frac{d_N}{d_S}\) є еволюція гена лізоциму у приматів. Білок лізоциму є ключовим компонентом для розпаду стінок бактерій. Ген лізоциму демонструє дуже швидку еволюцію білка (див. Філогенію на малюнку 1.1), особливо на родовищах, що ведуть до мавп (наприклад, гібонів та людей) та колобінів (наприклад, колобусів та лангурних мавп). Колобіни мають дієти на основі листя. Вони перетравлюють ці листя шляхом бактеріального бродіння в передньому відділі, а потім використовують лізоцими для розщеплення бактерій, щоб витягти енергію з листя. У колобінів білок лізоциму еволюціонував, щоб добре працювати в середовищі шлунка з високим рН. Примітно, що білок лізоциму Colobine конвергентно розвивав цю активність завдяки дуже схожим амінокислотним змінам при 5 ключових залишках у корів та хоатцинів.

зображення

Тест Макдональда-Крейтмана

Як зазначалося вище, велика проблема з використанням\(\frac{d_N}{d_S}\) для виявлення адаптації полягає в тому, що вона дуже консервативна. Для більш потужного тесту швидкої дивергенції нам потрібно підлаштувати рівень обмеження, який переживає ген на несинонімічних ділянках. Один із способів зробити це - використовувати дані поліморфізму як внутрішній контроль. Якщо ми бачимо мало несинонімічного поліморфізму в гені, але багато синонімічного поліморфізму, ми тепер знаємо, що існує, ймовірно, сильне обмеження на ген (тобто високий\(C\)), тому ми очікуємо, що він буде низьким.\(\frac{d_N}{d_S}\) розробив простий тест нейтральної теорії молекулярної еволюції при ген, заснований на цій інтуїції. взяв випадок, коли ми маємо дані поліморфізму в гені для одного виду і розбіжності до близькоспоріднених видів. Вони розділили поліморфізм і закріпили відмінності в своїй вибірці на кількість несинонімічних і синонімічних змін:

	Полі.	Фіксований
Не-син.	\(P_N\)	\(D_N\)
Син.	\(P_S\)	\(D_S\)
Співвідношення	\(P_N/P_S\)	\(D_N/D_S\)

[Рис:MK_дерево]

За нейтральною теорією ми очікуємо меншу кількість несинонімічних фіксованих відмінностей (\(D_N/D_S < 1\)) і точно таке ж очікування тримає для поліморфізму (\(P_N/P_S\)). Розглянемо ген з\(L_S\) і\(L_N\) сайти, де можуть виникнути синонімічні та несинонімічні мутації відповідно. Ми можемо думати про генеалогію генів, що лежить в основі нашого гена, див. Рисунок\ ref {Fig:MK_Tree}, із загальним часом на коалесцирующій генеалогії в межах виду,\(T_{tot}\) а також загальним часом для фіксованих відмінностей між нашими видами\(T_{div}'\), як, зверніть увагу,\(T_{div}'\) що загальний час, коли може виникнути алель, який буде з'являтися як заміщення. Тоді під нейтральністю ми очікуємо\(\mu L_N (1-C) T_{tot}\) несинонімічних поліморфізмів (тобто нашої кількості розділених ділянок) та\(\mu L_N (1-C) T_{div}'\) несинонімічних фіксованих відмінностей. Потім ми можемо заповнити решту нашої таблиці наступним чином:

	Полі.	Фіксований
Не-син.	\(\mu L_N (1-C) T_{tot}\)	\(\mu L_N (1-C) T_{div}'\)
Син.	\(\mu L_S T_{tot}\)	\(\mu L_S T_{div}'\)
Співвідношення	\(L_N(1-C)/( L_S)\)	\(L_N (1-C) / ( L_S)\)

Тому ми очікуємо, що співвідношення несинонімічних до синонімічних змін буде однаковим для поліморфізму та дивергенції за суворою нейтральною моделлю. Ми можемо перевірити це очікування рівних коефіцієнтів за допомогою стандартних тестів\(2 \times 2\) таблиці. Якщо коефіцієнт\(N/S\) значно вище для розбіжності, ніж поліморфізм, ми маємо докази того, що несинонімічні заміни накопичуються швидше, ніж ми б прогнозували лише задані рівні обмеження.

Як приклад таблиці Mcdonald-Kreitman (MK) розглянемо роботу над молекулярною еволюцією L фотопігментного опсину у метеликів адмірала (Limenitis), відповідальних за кольоровий зір у довгохвильовій частині зорового спектра. встановлено, що чутливість цього опсину мала змістився в бік синього за своєю чутливістю у L. archippus archippus (віце-короля) порівняно з L. arthemis astyanax. Щоб перевірити, чи відображала ця молекулярна еволюція позитивний відбір, вони секвенували 24 особи L. arthemis astyanax та одну послідовність L. archippus archippus archippus. Вони ідентифікували 11 поліморфних ділянок у L. arthemis astyanax і 16 фіксованих відмінностей, які розбиваються наступним чином:

зображення

	Полі.	Фіксований
Не-син.	\(2\)	\(12\)
Син.	\(9\)	\(4\)
Співвідношення	\(\frac{2}{9}\)	\(\frac{3}{1}\)

Зверніть увагу на сильний надлишок несинонімічної дивергенції порівняно з поліморфізмом (p-значення\(0.006\), точний тест Фішера), який узгоджується з геном, що розвивається адаптивно серед двох видів. Ми очікували б приблизно лише\(3\) несинонімічних замін із 16 замін, якщо ген еволюціонував нейтрально (\(16 \times \frac{2}{11}\)).

Резюме

У диплоїдної популяції розміром\(N\) будь-який з набору\(2N\) вибірково еквівалентних (тобто нейтральних) алелів однаково ймовірно буде родоначальником всієї популяції в якийсь майбутній віддалений момент часу. Тому ймовірність того, що нова мутація з часом фіксується в популяції, є\(\frac{1}{2N}\).
За моделлю, де\(C\) частка нових мутацій є нейтральними, а\(1-C\) мутації сильно згубні,\(2NC\mu\) мутації виникають у кожного покоління, яке може стати заміною. Тому коефіцієнт нейтрального заміщення за генерацію є\(2N(1-C)\mu \times \frac{1}{2N} = (1-C)\mu\). Це не залежить від чисельності населення і просто залежить від рівнів обмеження та швидкості мутації.
Постійна швидкість нейтрального заміщення породжує молекулярний годинник за покоління, який потенційно може бути використаний для оцінки constraint (\(C\)) та швидкості мутації.
Багато резюме та тести молекулярної еволюції, наприклад\(\frac{d_N}{d_S}\), засновані на порівнянні швидкостей заміщення між функціональними класами сайтів. Вони дозволяють ідентифікувати різні рівні обмежень та виявляти сигнали адаптивного заміщення.
Тести молекулярної еволюції для адаптації, які також включають як дивергенцію, так і поліморфізм, наприклад тест Макдональда-Крейтмана, є потенційно потужними інструментами, оскільки рівні поліморфізму дозволяють дещо незалежну міру рівнів обмеження.

Вправа\(\PageIndex{3}\)

Припускаючи, що швидкість мутації\(\mu\) становить/gamete/генерація, а чисельність популяції - N диплоїдних індивідів, яка кількість нових мутацій, що вводяться в популяції кожного покоління?

Вправа\(\PageIndex{4}\)

Яка ймовірність фіксації унікальної нової, нейтральної мутації в популяції N гаплоїдних особин?

Вправа\(\PageIndex{5}\)

Чому DN/dS набагато менше одного для більшості генів нашого геному?

Вправа\(\PageIndex{6}\)

Ви послідовні ген в дрозофіла меланогастер і D. simulans. Ви спостерігаєте 5 несинонімічних замін з 500 баз, де можуть відбуватися несинонімічні заміни, і 15 синонімічних замін з 500 баз, де можуть відбуватися синонімічні заміни. Який рівень обмеженості на несинонімічних сайтах?

Вправа\(\PageIndex{7}\)

Аналізуючи дані поліморфізму та розбіжності гена, ви обчислюєте наступну таблицю Макдональда-Крайтмана.

	Поліморп.	Фіксований
Синонімічний	40	80
Несинонімічні	20	80

Виходячи з співвідношення несинонімічних до синонімічних поліморфізмів та враховуючи 80 синонімічних замін, скільки несинімних замін ви очікували б, якби цей ген еволюціонував нейтрально?
Чи відповідає ця таблиця гену, що еволюціонує нейтрально? Якщо ні, що може пояснити результати?