12: Вплив генетичного дрейфу на вибрані алелі
«Природний відбір - це механізм генерації надзвичайно високого ступеня неймовірності». —Р.А. Фішер
У попередньому розділі ми припускали, що відбір, що діє на наші алелі, був досить сильним, щоб ми могли ігнорувати дію генетичного дрейфу у формуванні частот алелів. Однак генетичний дрейф впливає на всі алелі, і тому в цьому розділі ми досліджуємо взаємодію селекції та дрейфу. Сильно відібрані алелі можуть бути втрачені з популяції через дрейф, коли вони рідкісні в популяції, тоді як як слабо корисні, так і слабо шкідливі алелі піддаються випадковим примхам генетичного дрейфу протягом усього часу в популяції. Розуміння взаємодії селекції та генетичного дрейфу є ключовим для розуміння того, наскільки малі популяції можуть бути обмежені мутацією у своїх швидкостях адаптації, і як можуть відрізнятися швидкості молекулярної та геномної еволюції у різних таксонів.
Стохастична втрата сильно відібраних алелів
Навіть сильно корисні алелі можуть бути втрачені від популяції, коли вони досить рідкісні. Це пояснюється тим, що кількість потомства, залишеного особинами наступному поколінню, в корені стохастично. Коефіцієнт відбору s =1% є сильним коефіцієнтом відбору, який може проганяти алель через популяції за кілька сотень поколінь після встановлення алеля. Однак, якщо особини мають в середньому невелику кількість потомства на покоління, перша особина, яка несе наш корисний алель, у якого в середньому1% більше дітей, ніж їх однолітки, може легко мати нульового потомства, що призведе до втрати нашого алелю, перш ніж він коли-небудь отримає шанс поширення.
Щоб зробити перший удар у цій проблемі, давайте подумаємо про дуже велику гаплоїдну популяцію, в якій одна людина починається з обраного аллеля, і запитати про ймовірність можливої втрати нашого обраного алеля, починаючи з цього єдиного екземпляра. Щоб вивести цю ймовірність loss (pL), ми скористаємося простим аргументом. Наш обраний алель буде врешті-решт втрачений з популяції, якщо кожна людина з алелем не зможе залишити нащадків.

Що ж, ми можемо думати про різні випадки:
- У нашому першому поколінні, ймовірно,P0 наш індивідуальний алель не залишає жодних копій себе наступному поколінню, і в цьому випадку наш алель втрачається (рис.12.1 А).
- Як варіант, наш алель може залишити одну копію себе наступному поколінню (з ймовірністюP1), і в цьому випадку з ймовірністюpL ця копія в кінцевому підсумку згасне (рис.12.1 B).
- Наш алель міг би залишити дві копії себе наступному поколінню (з ймовірністюP2), і в цьому випадку з ймовірністюp2L обидві ці копії в кінцевому підсумку зникнуть (рис.12.1 С).
- Більш загально, наш алель може залишити може залишитиk копії (k>0) самого себе наступному поколінню (з ймовірністюPk), і в цьому випадку з ймовірністюpkL всі ці копії в кінцевому підсумку зникнуть (наприклад, рис.12.1 D).
Підсумовуючи ці ймовірності, ми бачимо, що
pL=∞∑k=0PkpkL
Тепер нам потрібно буде вказатиPk, ймовірність того, що особина, яка несе наш обраний аллель, маєk потомство. Для того щоб ця популяція залишалася постійною в розмірах, ми будемо вважати, що особини без обраної мутації мають в середньому одне потомство на покоління, тоді як особини з нашим обраним алелем мають в середньому1+s потомство на покоління. Ми припустимо, що кількість потомства, яке має індивід, є Пуассоном, розподіленим із середнім1 значенням1+s, заданим або, тобто ймовірність того, що особа з вибраним аллелем маєi дітей, становить
Pi=(1+s)ie−(1+s)i!
ПідставляючиPk в рівняння вище, бачимо
pL=∞∑k=0(1+s)ke−(1+s)k!pkL=e−(1+s)(∞∑k=0(pL(1+s))kk!)
Термін в дужках сам по собі є експоненціальним розширенням, тому ми можемо переписати це рівняння як
pL=e(1+s)(pL−1)
Рішення дляpL дасть нам нашу ймовірність втрати для будь-якого коефіцієнта відбору. Давайте перепишемо наш результат з точки зору ймовірності уникнути втрати,pF=1−pL. Ми можемо переписати рівняння\ ref {prob_loss} як
1−pF=e−pF(1+s)
1−pF≈1−pF(1+s)+p2F(1+s)2/2
Вирішуючи це, ми виявляємо, що
pF=2s.
Таким чином, навіть алель з коефіцієнтом1% відбору має98% ймовірність втратити при першому введенні в популяції шляхом мутації.
Якщо швидкість мутації до нашого вигідного алелю єμ, і єN особини в нашій гаплоїдної популяції, тоNμ вигідні мутації виникають на покоління. Кожна з цих нових корисних мутацій має ймовірністьpF закріплення. Таким чином, кількість вигідних мутацій, що виникають на покоління, які в кінцевому підсумку зафіксуються в популяціїNμpF, є, і час очікування мутації, яка буде фіксувати виникати, є відповідним цьому:1NμpF. Таким чином, при адаптації до нового тиску селекції за допомогою нових мутацій, чисельності популяції, мутаційного цільового розміру та вибіркової переваги нових мутацій все має значення. Однією з причин, чому комбінації препаратів використовуються проти таких вірусів, як ВІЛ та малярія, є те, що, навіть якщо віруси адаптуються до одного з препаратів, вірусне навантаження (N) пацієнта значно знижується, що робить малоймовірним, що населенню вдасться виправити другий лікарський резистентний алель.
Диплоїдна модель стохастичної втрати сильно відібраних алелів.
Ми також можемо адаптувати цей результат до диплоїдної обстановки. Якщо припустити, що гетерозиготи1 для алеля мають в середньому1+hs діти, ймовірність1 алель не втрачається, починаючи від одиничного екземпляра в популяції, становить
pF=2hs
дляh>0. Зверніть увагу, що це дещо інша параметризація від нашої диплоїдної моделі в попередньому розділі; ось домінування нашого позитивно підібраного алеля,h щоh=1 відповідає повній селективній перевазі, вираженій у індивіда з лише єдиним екземпляром. Таким чином, ймовірність того, що корисний алель не втрачається, залежить лише від відносної переваги придатності гетерозиготи; це тому, що коли аллель рідкісний, він зазвичай присутній у гетерозигот, і тому його ймовірність уникнути втрати просто залежить від придатності цих людей порівняно з гомозиготи для родового алеля (припускаючи безпородну популяцію).

Приблизно за останні десять тисяч років адаптивні алелі, що надають стійкість до малярії, виникли в ряді генів і поширилися через людські популяції в районах, де малярія є ендемічною. Одним з особливо вражаючих випадків конвергентної еволюції у відповідь на тиск селекції, що накладається малярією, є численні зміни по всьому гену G6PD, які включають щонайменше 15 поширених варіантів лише в Центральній та Східній Азії, які знижують активність ферменту. Ці алелі зараз зустрічаються з комбінованою частотою близько 8% частоти в ендемічних малярією районах, рідко перевищуючи 20%. Чи всі ці варіанти надають стійкість до малярії, невідомо, але ряд цих алелів продемонстрували вплив проти малярії і, як вважають, мають вибіркову перевагу перед гетерозиготами,sh>5% де малярія є ендемічною.
Маючи 5% перевагу у гетерозигот, алель G6PD, присутній як єдиний екземпляр, матиме лише 10% ймовірність фіксації в популяції. Якщо це так, то чому адаптація малярії неодноразово відбувалася через зміни на G6PD? Ну, можливо, адаптація не почалася з єдиної копії вибраного аллеля. Скільки копій алелів дефіциту G6PD, як ми очікуємо, були сегрегації в популяції до зміни тиску на відбір?

За відсутності малярії ці алелі G6PD є шкідливими для носіїв, які страждають на дефіцит G6PD, що призводить до гемолітичної анемії, коли люди піддаються впливу різних сполук, особливо тих, що присутні в бобах фави. Там вище ста баз, де можуть виникати алелі дефіциту G6PD, тому, припускаючи швидкість мутації≈10−8 на базову пару на покоління, ми можемо приблизно оцінити швидкість мутацій, що виникають, які впливають на ген G6PDμ≈10−6 відповідно до покоління. За відсутності малярії селективна вартість того, щоб бути носієм гетерозигот алеля з дефіцитом G6PD, повинна була бути на порядку5% або більше, і, таким чином, частота алеля при балансі мутації-відбору була б≈10−60.05=2×10−5. Припускаючи ефективну чисельність населення2−20 мільйона осіб, приблизно п'ять-десять тисяч років тому це означає, що було б сорок-чотириста копій алелю дефіциту G6PD, присутніх у популяції, коли тиск на відбір змістився при введенні малярії. Шанс того, що один з цих нових адаптивних алелів втрачається, є,90% але шанс, що вони всі втрачені<(0.9)40≈0.02, є, тобто було б більше98% шансів, що адаптація відбудеться через один або кілька алелів на G6PD . Скільки алелів би уникнути дрейфу? Ну, з40−400 копіями алелів перед малярією, і кожен з них має10% ймовірність уникнути дрейфу, ми очікуємо, що між алелями40 G6PD4 і G6PD уникнути дрейфу і сприяти адаптації . Ми бачимо15 загальні алелі G6PD в Євразії, тому наша проста модель адаптації з балансу мутації-селекції здається розумною.

«Сито Халдейна» - це назва ідеї про те, що мутації, які сприяють адаптації, швидше за все, будуть домінуючими або принаймні домінуючими.
- Коротко поясніть цей аргумент словесною моделлю, що стосується результатів, які ми розробили в останніх двох розділах.
- Вважається, що сито Халдейна менш важливо для адаптації від раніше згубної стоячої варіації, ніж адаптація від нової мутації. Чи можете ви пояснити інтуїцію, що стоїть за цією ідеєю?
- Сито Халдейна, ймовірно, буде менш важливим у інбредних, наприклад, самоврядуваннях, популяціях. Чому це?
Взаємодія між генетичним дрейфом і слабким відбором
Для сильно відібраних алелів, як тільки алель уникнув початкових втрат на низьких частотах, його шлях буде детерміновано визначатися його коефіцієнтами вибору. Однак, якщо селекція слабка порівняно з генетичним дрейфом, стохастичність відтворення може відігравати певну роль у траєкторії, яку приймає алель, навіть коли вона поширена у популяції. Якщо відбір є досить слабким порівняно з генетичним дрейфом, то генетичний дрейф буде домінувати в динаміці алелей, і вони будуть вести себе так, ніби вони ефективно нейтральні. Таким чином, ступінь, в якій відбір може формувати закономірності молекулярної еволюції, буде залежати від відносних сильних сторін відбору та генетичного дрейфу. Але наскільки слабким повинен бути вибір на алелі для дрейфу, щоб пересилити вибір? І чи мають ці взаємодії між відбором та дрейфом довгострокові наслідки для еволюції загальногеномних моделей?

Для моделювання вибору та дрейфу кожного покоління ми можемо спочатку обчислити детерміновану зміну частоти алелів через вибір за допомогою нашої детермінованої формули. Потім, використовуючи нашу нещодавно розраховану очікувану частоту алелів, ми можемо біноміально вибірку двох алелів для кожного нашого потомства, щоб побудувати наступне покоління. Такий підхід до спільного моделювання генетичного дрейфу і селекції називається моделлю Райта-Фішера.
За моделлю Райта-Фішера ми обчислимо очікувану зміну частоти алелів через вибір та дисперсію навколо цього очікування через дрейф. Щоб зробити наші розрахунки простіше, припустимо адитивну модельh=1/2,s≪1 т¯w≈1. Е. Використовуючи нашу детерміновану модель спрямованого вибору, з Chapter\ ref {chapter:OneLocusSelection}, і ці наближення дають нам детерміновані зміни внаслідок вибору
ΔSp=E(Δp)=s2p(1−p)
Щоб отримати нашу нову частоту в наступному поколінніp1, ми біноміально вибірки з нашої нової детермінованої частотиp′=p+ΔSp, тому дисперсія в нашій частоті алелів змінюється від одного покоління до наступного задається
Var(Δp)=Var(p1−p)=Var(p1)=p′(1−p′)2N≈p(1−p)2N.
де попередня частота алелівp випадає, оскільки вона є постійною, і дисперсія в нашій новій частоті алелів випливає з того факту, що ми біноміально відбираємо2N нові алелі з частоти,p′ щоб сформувати наступне покоління.
Щоб отримати наш перший погляд на відносні ефекти відбору проти дрейфу, ми можемо просто подивитися, коли наша зміна частоти алелів, спричинена відбором в межах покоління, досить сумлінно передається через покоління. Зокрема, якщо наша очікувана зміна частоти алелів набагато більша, ніж дисперсія навколо цієї зміни, генетичний дрейф відіграватиме невелику роль у долі нашого обраного алеля (як тільки аллель не має низького числа копій у популяції). Коли відбувається селекція домінантний генетичний дрейф? Це станетьсяE(Δp)≫Var(Δp), якщо, тобто коли|Ns|≫1. І навпаки, будь-яка надія на обраний нами алель після його детермінованого шляху буде швидко скасована, якщо наша зміна частот алелів через вибір набагато менше, ніж дисперсія, викликана дрейфом. Отже, якщо абсолютне значення нашого масштабованого коефіцієнта відбору чисельності населення|Ns|≪1, то дрейф буде домінувати над долею нашого алеля.

Для подальшого прогресу в розумінні долі алелей з коефіцієнтами відбору порядку1N потрібно більш ретельне моделювання. Однак за нашою диплоїдною моделлю, з коефіцієнтом адитивного відборуs, ми можемо отримати ймовірність того, що алель1 фіксується всередині популяції, починаючи з частотиp:
pF(p)=1−e−2Nsp1−e−2Ns
Доказ цього результату наведено нижче (див. Розділ 1.1). Новий алель, який надходить в популяції з частотою,p=1/(2N) має ймовірність досягнення фіксації
pF(12N)=1−e−s1−e−2Ns
Якщоs≪1 алеNs≫1 тодіpF(12N)≈s, що чудово повертає нам результат, який ми отримали вище для алеля при сильному відборі (Equation\ ref {eqn:diploid_escape}). Наша ймовірність фіксації (Equation\ ref {eqn:new_mut_prob_fixed}) побудована як функціяs іN на рис12.7. Щоб відновити наш нейтральний результат, ми можемо взяти межу,s→0 щоб отримати нашу нейтральну ймовірність фіксації12N.
У разі, колиNs знаходиться близько до1, то
pF(12N)≈s1−e−2Ns
Це більше, ніж наш попередній результатpF=s від аргументу процесу розгалуження (використовуючи нашу адитивну модельh=1/2), все частіше для меншихN. Чому це? Ну, у меншій популяції нова мутація починається з більш високою частотою (\(\frac{1}{2N}\)), ніж у більшої популяції, це дає початковий поштовх вибраному алелю в менших популяціях.

Якщо для вибору працювати на алелі, нам потрібен коефіцієнт відбору, щоб задовольнити|Ns|≫1, то, що тримає, якщо|s|≫1N. Ну, ефективні розміри населення часто досить великі, на порядку сотень тисяч або мільйонів людей, таким чином, коефіцієнти відбору на порядку10−5 до10−6 можуть бути ефективно обрані на, вони представляють неймовірно незначні (дис) переваги з точки зору кількості потомства, яке вони залишають наступному поколінню (див. Малюнок12.8). Хоча ми не в змозі виявити вимірювання всіх, крім великих розмірів фітнес-ефекту, за винятком деяких елегантних експериментів (наприклад, у мікробів), такі малі ефекти видно для виділення у великих популяціях. Таким чином, якщо послідовний тиск відбору чиниться протягом тривалих періодів часу, природний відбір може потенційно тонко налаштувати різні аспекти організму.
Як один із прикладів цієї тонкої настройки, розглянемо, наскільки ретельно розроблена та оптимізована послідовність кодонів для перекладу. Через переродження білкового коду кілька кодонів кодують одну і ту ж амінокислоту. Наприклад, існує шість різних кодонів, які можуть кодувати лейцин. Хоча ці синонімічні кодони еквівалентні на рівні білка, клітини відрізняються кількістю молекул тРНК, які пов'язують ці кодони, і тому ефективністю та точністю, з якою білки можуть утворюватися шляхом перекладу та складання. Ці незначні відмінності в швидкості перекладу, ймовірно, часто відповідають крихітним відмінностям у придатності, але чи мають вони значення?

У багатьох організмах існує сильне зміщення кодонів для кодування певних амінокислот, див. Рис.\ ref {Fig:Leucine}, причому найпоширеніший кодон відповідає найбільш поширеній тРНК у клітині. Цей «кодоновий ухил», ймовірно, відображає комбіновану дію слабкого відбору та мутаційного тиску, підштовхуючи кодоновий склад достатку генома та тРНК до адаптивного компромісу. Ці тиск на відбір діяли протягом довгих періодів часу, оскільки моделі використання кодонів часто дуже схожі для видів, які розходилися протягом багатьох десятків мільйонів років тому. Порівняно з іншими генами, високовиражені гени демонструють сильний ухил до використання кодонів, що відповідають рясним ТРНК, що відповідає думці про те, що синонімічний вміст кодонів високоекспресованих генів розвивається для оптимізації їх перекладу (див. Рисунок\ ref {fig:gene_expression_codon_bias} для раннього прикладу). Ці моделі, ймовірно, представляють дію тиску на відбір, які в середньому неймовірно слабкі, але які грали протягом величезних часових періодів.
Фіксація злегка згубних алелей
З малюнка12.7 ми бачимо, що слабо згубні алелі також можуть фіксуватися, особливо в невеликих популяціях. Щоб зрозуміти, наскільки ймовірно, що згубні алелі випадково досягають фіксації генетичним дрейфом, припустимо диплоїдну модель з адитивним відбором (з коефіцієнтом відбору−s проти нашого алелю2).
ЯкщоNs≫1 тоді наш згубний алель (алель2) не може досягти фіксації. Однак якщоNs не велика, то ймовірність фіксації
pF(12N)≈se2Ns−1
для нашого одноразового згубного алелю. Тож згубні алелі можуть фіксуватися всередині популяцій (хоча і з низькою швидкістю),Ns якщо вони не надто великі. Як вище, це пов'язано з тим, що хоча згубні мутації ніколи не уникнуть втрат у нескінченних популяціях, вони можуть закріпитися в кінцевій популяції, досягнувши2N копій.
Виникає адитивна мутація, яка знижує відносну придатність гетерозигот10−5. Яка ймовірність того, що ця мутація фіксується у диплоїдної популяції з ефективним розміром104? Яку ймовірність вона фіксує в популяції ефективного розміру106? Порівнюючи обидва з їх нейтральною ймовірністю, опишіть інтуїцію, що стоїть за цим результатом.
OHTA запропонував «майже нейтральну» теорію молекулярної еволюції в серії робіт. Вона припустила, що розумна частка знову виникаючих функціональних мутацій може мати дуже слабкі коефіцієнти відбору, так що види з меншими ефективними розмірами популяцій можуть мати більш високі показники фіксації цих дуже слабо згубних алелів. По суті, її припущення полягає в тому, що параметрC обмеження функціональної області не є фіксованою властивістю, а скоріше залежить від здатності населення протистояти припливу дуже слабо згубних мутацій.

dNdSУ різних видах середні показники геному, здається, співвідносяться з показниками ефективної чисельності популяції (наприклад, синонімічного різноманіття), див12.9. Рис. Ці дані підтверджують думку про те, що у видів з меншими ефективними розмірами популяції (меншимиπS) білки можуть піддаватися більш низьким ступеням обмеженості, оскільки дуже слабо згубні мутації здатні фіксувати. Таким чином, деяка розумна частка функціональних заміщень у популяціях з невеликими ефективними розмірами населення, таких як люди, може бути м'яко згубною.
Додаток: Імовірність фіксації слабо відібраних алелів
Яка ймовірність того, що слабо корисна або шкідлива добавка фіксує алель у нашій популяції? МиP(Δp) дозволимо ймовірність того, що наша частота алелів зміщуєтьсяΔp в наступному поколінні. Використовуючи це, і слідуючи дифузійному аргументу, ми можемо записати нашу ймовірністьpF(p) фіксації через ймовірність досягнення фіксації, усередненої по частоті в наступному поколінні
pF(p)=∫pF(p+Δp)P(Δp)d(Δp)
Це дуже схоже на техніку, яку ми використовували, виводячи нашу ймовірність уникнути втрат у дуже великій популяції вище.
Таким чином, нам потрібен вираз дляpF(p+Δp). Щоб отримати це, ми зробимо розширення серії ТейлораpF(p), припускаючи, щоΔp це мало:
pF(p+Δp)≈pF(p)+ΔpdpF(p)dp+(Δp)2d2pF(p)dp2(p)
ігнорування умов вищого порядку.
Беручи очікування з обохΔp сторін, як у Рівнянні\ ref {eqn:prob_fix_diff_step1}, отримаємо
pF(p)=pF(p)+E(Δp)dpF(p)dp+E((Δp)2)d2pF(p)dp2
Ну,E(Δp)=s2p(1−p) іVar(Δp)=E((Δp)2)−\E2(Δp), так якщоs≪1 тоді\E2(Δp)≈0, іE(Δp)2=p(1−p)2N. Підставляючи ці значення і віднімаючиp з обох сторін нашого рівняння, це залишає нас
0=s2p(1−p)dpF(p)dp+p(1−p)2Nd2pF(p)dp2
і ми можемо вказати граничні умови, щоб бутиpF(1)=1 іpF(0)=0. Вирішення цього диференціального рівняння є дещо цікавим процесом, але при цьому ми виявляємо, що
pF(p)=1−e−2Nsp1−e−2Ns
Цей доказ може бути поширений на алелі з довільним домінування, однак це не призводить до аналітично виразу, тому ми не переслідуємо цього тут.
Розділ 12 резюме
- Навіть сильно вигідні алелі можуть бути втрачені, коли вони рідкісні у популяції. У гаплоїдної популяції ймовірність того, що сильно вигідний алель уникає втрати, починаючи з єдиного екземпляра, єpF=2s. У диплоїдної популяції така ймовірність єpF=2hs, деhs відносна перевага придатності до гетерозигот. Сильно згубні алелі не можуть закріпитися у великих популяціях.
- Алелі сильно відібрані, коли їх абсолютний коефіцієнт відбору, масштабований за чисельністю населення|Ns|≫1. Алелі ефективно нейтральні при|Ns|≪1. Алелі, які слабо відібрані,|Ns| коли їх на замовлення1.
- Динаміка слабо відібраних алелів підлягає селекції та генетичному дрейфу протягом усього часу їх перебування в популяції, а ймовірність їх фіксації (pF) залежить відN іs.
- Дуже слабо відібрані алелі можуть бути ефективно відібрані на великих популяціях. Таким чином, рівні еволюційного обмеження можуть бути сильнішими у видів з великими довгостроковими розмірами популяції.
Меланові білки страждають більш високою швидкістю хижацтва (через яструбів), ніж зазвичай сірі пігментовані білки. Меланізм обумовлений домінуючою, аутосомною мутацією. Частота меланових білок при народженні становить4×10−5.
- Якщо швидкість мутації до нових меланових алелів становить10−6, припускаючи, що мелановий алель знаходиться в рівновазі мутації-відбору, що таке зниження придатності гетерозиготи? Раптом рівень забруднення різко зростає в нашому населенні, і хижацтво яструбами тепер пропонує рівну (і протилежну) перевагу темним особам, як це колись пропонувалося нормально пігментованим особам.
- Яка ймовірність того, що одиничний екземпляр цього алеля (присутній всього один раз у популяції) втрачається?
- Якщо чисельність популяції наших білок становить мільйон особин і знаходиться на балансі мутації-відбору, яка ймовірність того, що популяція адаптується від одного або декількох алелів із стоячого басейну меланових алелів?
Ви виявите, що попарне генетичне різноманіття у людини0.0005 є/bp, а у тарганів0.01 є/bp. Припустимо, що у обох видів швидкість мутації становить близькоμ=2×10−8 /bp/генерації у обох видів. Припустимо, ви вводите згубну мутацію в кожну популяції з селективним коефіцієнтомs=10−6. Обчисліть ймовірність закріплення цього алеля у людини і тарганів, враховуючи, що алель починається в одному екземплярі (по частоті12N). Порівняйте свою відповідь з нейтральною ймовірністю фіксації мутантного алеля в обох випадках.