Loading [MathJax]/jax/output/HTML-CSS/jax.js
Skip to main content
LibreTexts - Ukrayinska

5.5: Випадковий генетичний дрейф

До цих пір наші спрощені генетичні моделі передбачали нескінченну популяцію, нехтуючи стохастичними ефектами. Тут розглядається кінцева популяція: результуючі стохастичні ефекти на алельні частоти називають випадковим генетичним дрейфом. Найпростіша генетична модель, що включає випадковий генетичний дрейф, передбачає популяціїN особин фіксованого розміру та моделює еволюцію діалельного гаплоїдного генетичного локусу.

Існує дві широко використовувані генетичні моделі для скінченних популяцій: модель РайтФішера та модель Морана. Модель Райта-Фішера найбільш схожа на нашу модель дискретного покоління з нескінченною популяцією. У моделі Райта-ФішераN дорослі особини виділяють дуже велику кількість гамет в генофонд, а наступне покоління формується зN випадкових гамет, самостійно обраних з генофонду. Модель Морана використовує інший підхід. У моделі Морана один крок еволюції складається з однієї випадкової індивіди в популяції, що відтворюється, а інша випадкова особина вмирає, при цьому популяція завжди підтримується в постійному розміріN. Оскільки дві випадкові події відбуваються в кожному поколінні в моделі Морана, аN випадкові події відбуваються в кожному поколінні в моделі Райта-Фішера, загальна кількість етапівN/2 еволюції в моделі Морана порівнянна, але не зовсім ідентична, з одним дискретним поколінням в Модель Райта-Фішера. Однак було показано, що дві моделі стають ідентичними в межі великихN. Для наших цілей модель Морана математично більш зрозуміла, і ми приймаємо її тут.

Ми розробляємо нашу модель аналогічно стохастичній моделі зростання популяції, отриманої в§3.1. nПозначимо кількістьA -алелей в популяції,Nn а кількістьa -алелей. Приn=0,1,2,,N дискретній випадковій величині функція маси ймовірностіpn(g) позначає ймовірність наявностіnA -алелей на етапі еволюціїg. Зn А-алелями в популяції розміром N, ймовірність особи, яка відтворює або вмирає, задаєтьсяsn=n/N; відповідна ймовірність дляa є1sn.A Існує три способи отримання популяціїnA -алелей на етапі еволюціїg+1. По-перше, булиnA -алелі на етапі еволюціїg, і індивіда, що відтворює, несла той самий алель, що і індивід, що вмирає. По-друге, на етапі еволюціїn1 були -алеліg, і індивід, що відтворює,A і індивід, що вмираєa. І по-третє, булиn+1A -алелі на етапі еволюціїg, і індивід, що відтворює має,a і індивід вмираєA. Множення ймовірностей та підсумовування трьох випадків призводить до

pn(g+1)=(s2n+(1sn)2)pn(g)+sn1(1sn1)pn1(g)+sn+1(1sn+1)pn+1(g)

Зауважте, що це рівняння дійсне для0<n<N, і що рівняння на границях, що представляють ймовірності того, що один з алелей фіксований - є

p0(g+1)=p0(g)+s1(1s1)p1(g)pN(g+1)=pN(g)+sN1(1sN1)pN1(g)

Межі називаються абсорбуючими і ймовірність фіксації алеля монотонно зростає з кожним народженням і смертю. Як тільки ймовірність фіксації алеля дорівнює одиниці, подальших змін частот алелів не відбувається.

Проілюструємо рішення(5.5.1) - (5.5.3) на рис. 5.3для малої чисельності населенняN=20, і де числоA -алелей точно відомо в поколінні заснування, з або (а)p10(0)=1, або; (б)p13(0)=1. Побудовано масову густину ймовірності кількостіA -алелей на кожному етапіN еволюції, аж до7N кроків, що відповідають приблизно чотирнадцяти дискретним поколінням еволюції в моделі Райта-Фішера. Зверніть увагу, як розподіл ймовірностей розсіюється від його початкового значення, і як ймовірності в кінцевому підсумку концентруються на кордоні, причому обидваp0 іp20 монотонно збільшуються. Насправді після великої кількості поколіньp0 наближається до початкової частотиa -аллеля іp20 наближається до початкової частотиA -аллеля (на малюнках не показана).

зображення
Малюнок 5.3:pn протиn сN=20. Еволюції етапи побудовані відповідаютьg=0,N,2N,,7N. (а) Початкова кількістьA осіб єn=10. (б) Початкова кількістьA осібn=13 є. і зауважте, щоS(x)=x. Аналогічно, ми маємоsn+1=S(x+Δx) іsn1=S(xΔx), деΔx=1/N. Тоді, зΔt=2/N,(5.5.4) перетворюється в<\ p>

P(x,t+Δt)P(x,t)=S(x+Δx)(1S(x+Δx))P(x+Δx,t)2S(x)(1S(x))P(x,t)+S(xΔx)(1S(xΔx))P(xΔx,t)

Для подальшого спрощення використано відоме центрально-різницеве наближення до другої похідної функціїf(x),

f(x)=f(x+Δx)2f(x)+f(xΔx)Δx2+O(Δx2)

і розпізнати праву частину (5.5.7) чисельником другої похідної. ЗΔx=Δt/2=1/N0, іS(x)=x, виводимо до порядку відведення в рівнянні1/N з частинними похідними

P(x,t)t=122x2(V(x)P(x,t))

із

V(x)=x(1x)N

Для інтерпретації значення функціїV(x) ми будемо використовувати наступний результат теорії ймовірностей. Дляn самостійних випробувань кожен з ймовірністю успіхуp і ймовірністю невдачі1p число успіхів, що позначаєтьсяX, є біноміальною випадковою величиною з параметрами(n,p). Загальновідомими результатамиE[] єE[X]=np іVar[X]=np(1p), де очікуване значення, іVar[] є дисперсія.

Тепер кількістьA -алелей, обраних при формуванні наступного покоління Райта-Фішера, є біноміальною випадковою величиноюn з параметрами(N,n/N). ТомуE[n]=n іVar[n]=n(1n/N). Зx=n/N іx=n/N, у насE[x]=x, іVar[x]=x(1x)/N. Тому функціюV(x) можна інтерпретувати як дисперсіюx над одним поколінням Райта-Фішера.

Хоча (5.5.9) і (5.5.10) явно залежать від чисельності населенняN, чисельність населення може бути усунена простою зміною змінних. Якщо ми дозволимо

τ=t/N

тоді диференціальне рівняння (5.5.9) перетворюється на

P(x,τ)τ=122x2(x(1x)P(x,τ))

незалежний відN. Зміна змінних, задана (5.5.11), просто стверджує, що подвоєння чисельності популяції подовжить часову шкалу еволюції на відповідний коефіцієнт у два рази. Пам'ятайте, що тут ми вже працюємо під припущенням, що чисельність населення велика.

Рівняння (5.5.12) являє собою дифузійно-подібне рівняння для функції розподілу ймовірностейP(x,τ). Дифузійне наближення для вивчення генетичного дрейфу було вперше введено в популяційну генетику її засновниками Фішером і Райтом, а пізніше широко розроблено в1950 s японським біологом Motoo Kimura. Тут наш аналіз цього рівняння спирається на більш свіжу роботу Маккейна і Ваксмана (2007), які показали, як побудувати аналітичне рішення (5.5.12) на межахx. Бо0<x<1, це наводить на думку з числових рішень, показаних на рис. 5.3що розподіл ймовірностей може асимптотично стати незалежним відx. Відповідно, шукаємо асимптотичне рішення для(5.5.12) внутрішніх значеньx задовольняютьP(x,τ)=P(τ). Рівняння (5.5.12) стає

dP(τ)dτ=12(x(1x))P(τ)=P(τ)

з асимптотичним розчином

P(τ)=ceτ

і ми спостерігаємо, що сумарна ймовірність над внутрішніми значеннямиx розпадається в геометричній прогресії.

Щоб зрозуміти, як поводиться рішення на кордоніx, потрібні граничні умови дляP(x,τ). Насправді, оскількиP(x,τ) є одниною на кордоніx, відповідні граничні умови не можуть бути отримані безпосередньо з різницевих рівнянь, заданих (5.5.2 і 5.5.3). Швидше за все граничні умови найлегше отримати при першому переказуванні (5.5.12) у вигляді рівняння неперервності.

Давайтеj(x,τ) позначимо так званий струм ймовірності. У невеликій області розміру,Δx що лежить в інтервалі(x,x+Δx), часова швидкість зміни ймовірностіP(x,τ)Δx обумовлена потоком ймовірності в цю область і з неї. При відповідному визначенні ймовірності струму ми маємо в загальному

τ(P(x,τ)Δx)=j(x,t)j(x+Δx)

або якΔx0,

P(x,τ)τ+j(x,τ)x=0

яка є звичайною формою рівняння неперервності. Ідентифікація (5.5.15) з (5.5.12) показує, що ймовірність струму нашої задачі задається

j(x,τ)=12x(x(1x)P(x,τ)).

Тепер, оскільки повна ймовірність є єдністю; тобто

10P(x,τ)dx=1

ймовірність не може протікати в межах або за межіx, і тому ми повинні мати

j(0,τ)=0,j(1,τ)=0,

які є відповідними граничними умовами для (5.5.12).

Ми можемо шукати стаціонарні рішення (5.5.12). Використання рівняння неперервності (5.5.15) разом з граничними умовами (5.5.18) показує, що стаціонарне рішення має нульовий струм ймовірності; тобтоj(x)=0. Інтеграціяj(x) використання (5.5.16) призводить до

x(1x)P(x)=c1

деc1 - константа інтеграції. Легко очевидним рішенням єP(x)=c1/[x(1x)], але є також два менш очевидних рішення. Функціям розподілу ймовірностей дозволено містити сингулярні розв'язки, що відповідають дельта-функціям Дірака, і тут розглядається можливість існування дельта-функцій Дірака на границях. Помітивши, що обидваxδ(x)=0 і(1x)δ(1x)=0, ми можемо побачити, що загальне рішення дляP(x) може бути записано як

P(x)=c1x(1x)+c2δ(x)+c3δ(1x).

P(x)Вимога задовольнити (5.5.17) призводить доc1=0 іc2+c3=1. Щоб визначити залишилася вільну константу, ми можемо обчислити середню частотуA -аллеля в популяції. З рівняння(5.5.15) неперервності ми маємо

τ10xP(x,τ)dx=10xj(x,τ)xdx=10j(x,τ)dx=0

де перший інтеграл з правого боку був зроблений частинами з використанням граничних умов, заданих (5.5.18), а другий інтеграл був зроблений за допомогою (5.5.16) і зникненняx(1x)P(x) на кордоні. Отже, середня частотаA алеля є постійною, як можна було б очікувати для ненаправленого випадкового генетичного дрейфу - і ми можемо припустити, що його початкове значення єp. Тому ми отримуємо для нашого стаціонарного рішення

P(x)=(1p)δ(x)+pδ(1x)

Отже, можлива ймовірність фіксаціїA -алеля просто дорівнює його початковій частоті. Наприклад, припустимо, що в межах популяції одноріднихN для однорідної дляa однієї нейтральної мутації відбувається так, що одна особина тепер несеA -аллель. Яка ймовірність того, щоA -аллель врешті-решт стане фіксованим? Наш результат дасть ймовірність1/N, яка є початковою частотоюA -аллеля. Інтуїтивно, після того, як пройшла достатня кількість поколінь, всі живі особини повинні бути нащадками від єдиного родового індивіда, що живе в той момент, коли сталася єдина мутація. Імовірність того, що ця одинична особина неслаA -аллель, справедлива1/N.

Відзначимо далі, що Кімура першим знайшов аналітичне рішення рівняння дифузії (5.5.12). Метод розв'язання з використанням перетворень Фур'є можна знайти в додатку Маккейна і Ваксмана (2007). Окрім використання дельта-функцій Дірака, цим авторам потрібні крокові функції Хевісайда, функції Бесселя, сферичні функції Бесселя, гіпергеометричні функції, поліноми Лежандра та поліноми Гегенбауера. Отриманий розчин має форму

P(x,τ)=Π0(τ)δ(x)+Π1(τ)δ(1x)+f(x,τ)

Якщо кількістьA -алелей відомо в початковий момент, а частота єp, то

P(x,0)=δ(xp)

іΠ0(0)=Π1(0)=0;f(x,0)=δ(xp). Якτ, у нас єf(x,τ)0;Π0(τ)1p іΠ1(τ)p

Ми можемо легко продемонструвати хоча б одне точне рішення форми (5.5.22). Для початкового рівномірного розподілу ймовірностей, заданого

P(x,0)=1,

розподіл ймовірностей у внутрішніх точках залишається рівномірним і задається(5.5.13) зc=1. Якщо взяти форму розв'язку, задану (5.5.22) разом з вимогою одиничної ймовірності, заданої (5.5.17), ми можемо отримати точний результат

P(x,τ)=12(1eτ)(δ(x)+δ(1x))+eτ