5.10: Проекти геному людини
- Page ID
- 5792
Незабаром після своїх прес-конференцій дві групи, які протягом декількох років прагнули картографувати геном людини, опублікували свої висновки:
- Міжнародний консорціум секвенування геному людини (IHGSC) у випуску «Природа» від 15 лютого 2001 року
- Celera Genomics, компанія в Роквіллі, штат Меріленд, у 16 лютому випуску Science
Ці досягнення були монументальними, але перш ніж ми їх розглянемо, давайте зрозуміємо, чим вони не були.
Те, що не було знайдено
- Жодна група не визначила повної послідовності генома людини. Кожна з наших хромосом - це єдина молекула ДНК. Одного дня послідовність пар основ в кожній буде відома від одного кінця до іншого. Але в 2001 році тисячі прогалин залишилося заповнити. Те, що вони зробили, було присутнім ряд чернеткових послідовностей, які представляли близько 90% (ймовірно, найцікавіших 90%) генома.
- Навіть узяті разом результати не дали точного підрахунку кількості генів, що кодують білок, в нашому геномі (на відміну від таких геномів, як ДНК мітохондрій, вірус Епштейна-Барр та багато бактеріальних геномів.
Одна з причин: велика кількість і великий розмір інтронів, які розщеплюють ці гени, ускладнюють розпізнавання відкритих кадрів читання (ОРФ), які кодують білки.
Кількість генів було набагато менше, ніж передбачалося
Дві групи придумали дещо різні оцінки кількості генів, що кодують білок, але обидві в діапазоні від 30 до 38 тисяч:
- ледь в два рази більше, ніж геноми
- Дрозофіли (~17 000 генів)
- С. елеганс (<22 000 генів)
- і представляють лише 1— 2% від загальної ДНК в клітині;
- і третина з 100,000 генів, які багато хто передбачив, буде знайдено.
- (До 2011 року кількість скоротилася до приблизно 21 000.)
Чи крихітні аскариди та дрозофіли майже такі ж складні, як і ми?
Напевно, ні, хоча ми поділяємо багато гомологічних генів (званих "ортологи «) з обома цими тваринами. Але багато наших генів, що кодують білок, виробляють більше одного білкового продукту (наприклад, шляхом альтернативного сплайсингу первинного стенограми гена). В середньому кожен з наших ORF виробляє від 2 до 3 різних білків. Так людський "протеом" (наше загальна кількість білків) може бути в 10 і більше разів більше, ніж у дрозофіл і аскариди.
Більша частка нашого геному кодує фактори транскрипції і присвячена контрольним елементам (наприклад, підсилювачам), до яких ці транскрипційні фактори зв'язуються. Комбінаторне використання цих елементів, ймовірно, забезпечує набагато більшу гнучкість експресії генів, ніж у Drosophila і C. elegans.
Генна різноманітність і щільність
Є деякі гіганти, такі як дистрофін, з його 79 екзонами, розкинутими на 2,4 мільйона пар основ ДНК та титину, 363 екзони яких можуть кодувати один білок цілих ~ 38 000 амінокислот. Середній ген людини містить 4 екзони на загальну суму 1350 пар основ і, таким чином, кодує середній білок 450 амінокислот. Щільність генів на різних хромосомах варіюється від 23 генів на мільйон пар основ на хромосомі 19 (загалом 1400 генів) до лише 5 генів на мільйон пар основ на хромосомі 13.
У людей багато генів, яких немає у безхребетних
Люди, і, мабуть, більшість хребетних, мають гени, яких немає у безхребетних тварин, таких як Drosophila та C. elegans. До них відносяться гени, що кодують:
- антитіла та рецептори Т-клітин до антигену (TCR)
- трансплантаційні антигени основного комплексу гістосумісності (MHC) (HLA, MHC людини)
- молекули, що сигналізують клітини, включаючи багато типів цитокінів
- молекули, які беруть участь у згортанні крові
- медіатори апоптозу. Хоча ці білки зустрічаються в Drosophila і C. elegans, у нас їх набагато багатший асортимент.
Дублювання генів
Обидві групи додали до списку генів людини, які виникли внаслідок повторного дублювання (наприклад, нерівного перетину) з одного гена-попередника; наприклад, гени (кілька сотень) для нюхових рецепторів та різні гени глобіну.
повторювана ДНК
Обидві групи перевіряли наявність великої кількості повторюваної ДНК. Фактично, ця ДНК - з подібними послідовностями, що відбуваються знову і знову - є однією з головних перешкод для складання послідовностей ДНК в належному порядку.
- ЛІНІЇ (довгі вкраплення елементів)
- SINES (короткі вкраплення елементів), включаючи елементи Alu
- Ретро транспозони
- Транспозони ДНК
Все сказано, що повторювана ДНК, ймовірно, становить понад 50% нашого загального генома.
Що ще належить зробити?
- Продовжуйте шукати гени.
Станом на березень 2010 року було позитивно ідентифіковано 19 956 генів, що кодують білок, але, ймовірно, ще належить знайти тисячу або більше.
- Визначаємо протеом людини; тобто загальний комплемент білків, які ми синтезуємо.
- Проаналізуйте, як координатно виражаються кластери генів
- в різних типах клітин
- в різний час життя клітини.
- Визначте геноми інших хребетних.
Це не тільки допоможе нам розпізнати більше людських генів, але й дасть нам уявлення про те, що робить нас унікальними.
Вже ми знаємо, що великі ділянки нашого генома мають тісно пов'язані гомологи у миші.
Приклади:- Колекція генів - і навіть їх порядок - на хромосомі людини 17 тісно збігається з даними хромосоми миші 11. Те ж саме стосується людської хромосоми 20 і хромосоми миші 2.
- Люди та миші (також щури) мають кілька сотень абсолютно однакових ділянок ДНК, що поширюються на 200—800 пар основ.
- Деякі присутні в екзоні генів, особливо гени, що беруть участь в обробці РНК.
- Деякі знаходяться в або поблизу інтронів генів, особливо гени, що кодують білки, що беруть участь у транскрипції ДНК.
- Деякі знаходяться між генами - особливо такими, як Pax6, необхідні для ембріонального розвитку - і можуть служити підсилювачами.