Skip to main content
LibreTexts - Ukrayinska

19: геноміка

  • Page ID
    6661
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    Геноміка - це поле, яке вивчає всю колекцію ДНК або геному організму. Він передбачає секвенування, аналіз та порівняння інформації, що міститься в геномах. Оскільки секвенування стало набагато менш дорогим і більш ефективним, зараз доступна величезна кількість геномної інформації про найрізноманітніші організми, але особливо мікроби, з меншим розміром геному. Насправді, найбільшим вузьким місцем в даний час є не відсутність інформації, а відсутність обчислювальної потужності для обробки інформації!

    Послідовність

    Секвенування або визначення базового порядку ДНК або РНК організму часто є одним з перших кроків до з'ясування детальної інформації про організм. Бактеріальний геном може варіюватися від 130 пар кілобази (kbp) до понад 14 пар мегабаз (Mbp), тоді як вірусний геном коливається від 0.859 до 2473 kbp. Для порівняння, геном людини містить близько 3 мільярдів пар основ.

    Послідовність рушниці

    Секвенування дробовика спочатку передбачає побудову геномної бібліотеки, де геном розбивається на фрагменти випадкового розміру, які вставляються в вектори для створення бібліотеки клонів. Фрагменти послідовні, а потім аналізуються комп'ютером, який шукає області, що перекриваються, щоб сформувати довший розтяг послідовності. Врешті-решт всі послідовності вирівнюються, щоб дати повну послідовність геному. Помилки зменшуються, оскільки багато клонів містять однакові або майже однакові послідовності, що призводить до хорошого «охоплення» генома.

    Shotgun-Sequencing-e1494877827761.png

    Послідовність рушниці. Комінс, Дж., Тофт, К., Фарес, М.А. [CC BY-SA 2.5], через Wikimedia Commons

    Секвенування ДНК другого покоління

    Секвенування ДНК другого покоління використовує масово паралельні методи, де кілька зразків секвенуються пліч-о-пліч. Фрагменти ДНК по кілька сотень основ підсилюються ПЛР, а потім прикріплюються до невеликої кульки, так що кожна кулька несе кілька копій одного і того ж ділянки ДНК. Намистини кладуть в тарілку, що містить більше мільйона лунок, кожна з яких має одну намистину, а фрагменти ДНК послідовні.

    Секвенування ДНК третього та четвертого поколінь

    Секвенування ДНК третього покоління передбачає секвенування окремих молекул ДНК. Секвенування ДНК четвертого покоління, також відоме як «секвенування після світла», використовує методи, відмінні від оптичного виявлення, для секвенування.

    Біоінформатика

    Після секвенування настав час осмислити інформацію. Область біоінформатики поєднує багато полів разом (тобто біологія, інформатика, статистика), щоб використовувати потужність комп'ютерів для аналізу інформації, що міститься в геномній послідовності. Розташування специфічних генів у геномі називається анотацією геному.

    Відкриті кадри читання (ORFS)

    Відкрита рамка зчитування або ORF позначає можливий ген, що кодує білок. Для дволанцюгової ДНК потрібно проаналізувати шість кадрів для читання, оскільки ДНК зчитується наборами по три основи одночасно і є дві нитки ДНК. ORF зазвичай має щонайменше 100 кодонів перед стоп-кодоном, з послідовностями термінаторів 3 '. Функціональний ORF - це той, який насправді використовується організмом для кодування білка. Комп'ютери використовуються для пошуку послідовності ДНК, шукаючи ORF, причому ті, як передбачається, кодують білок, додатково аналізуються біоінформатиком.

    Часто корисно порівнювати послідовність з базою даних послідовностей, кодуючих для відомих білків. GenBank - це база даних з понад 200 мільярдів базових пар послідовностей, до яких вчені можуть отримати доступ, щоб спробувати знайти збіги з послідовністю, що цікавить. Інструмент пошуку в базі даних BLAST (основний інструмент пошуку локального вирівнювання) має програми для порівняння як нуклеотидних послідовностей, так і амінокислотних послідовностей, забезпечуючи ранжування результатів у порядку зменшення подібності.

    BLAST-Results.jpg

    Результати BLAST.

    Порівняльна геноміка

    Після отримання послідовностей організмів змістовна інформація може бути зібрана за допомогою порівняльної геноміки. Для цього геноми оцінюються для отримання інформації щодо розміру, організації та вмісту генів.

    Порівняння генома мікробних штамів дало вченим кращу картину щодо генів, які організми підбирають. Група з декількох штамів поділяють основний геном, гени, кодуючи важливі клітинні функції, які всі вони мають спільне. Геном пан представляє всі гени, знайдені у всіх представників видів, тому дає гарне уявлення про різноманітність групи. Більшість з цих «зайвих» генів, ймовірно, підхоплені горизонтальним перенесенням генів.

    Порівняльна геноміка також показує, що багато генів виводяться в результаті дублювання генів. Гени всередині одного організму, які, ймовірно, виникли через дублювання генів, називаються паралогами. У багатьох випадках один з генів може бути змінений, щоб взяти на себе нову функцію. Також можливе виявлення дублювання генів у різних організмів в результаті придбання вихідного гена від загального предка. Ці гени називаються ортологами.

    Функціональна геноміка

    Послідовність генома і розташування генів забезпечують частину картини, але для того, щоб повністю зрозуміти організм, нам потрібно уявлення про те, що робить клітина зі своїми генами. Іншими словами, що відбувається при вираженні генів? Тут відбувається функціональна геноміка - розміщення геномної інформації в контексті.

    Першим кроком експресії генів є транскрипція або виготовлення РНК. Транскриптом відноситься до всього доповнення РНК, яке клітина може зробити зі свого генома, тоді як протеом відноситься до всіх білків, кодованих геномом організмів, на заключному етапі експресії генів.

    Мікромасиви

    Мікромасиви або генні чіпи - це тверді опори, на які розміщуються множинні плями ДНК, подібно до сітки. Кожна пляма ДНК являє собою один ген або ORF. Відомі фрагменти нуклеїнової кислоти маркуються і використовуються як зонди, при цьому сигнал виробляється, якщо відбувається зв'язування. Мікромасиви можуть бути використані для визначення того, які гени можуть бути ввімкнені або вимкнені за певних умов, таких як порівняння зростання бактеріального збудника всередині господаря та поза господарем.

    Протеоміка

    Вивчення білків організму (або протеома) називають протеомікою. Значна частина інтересу зосереджена на функціональній протеоміці, яка вивчає функції клітинних білків та способи їх взаємодії між собою.

    Однією з поширених методик, що використовується при вивченні білків, є двовимірний гелевий електрофорез, який спочатку відокремлює білки на основі їх ізоелектричних точок. Це досягається за допомогою градієнта рН, який відокремлює білки на основі вмісту їх амінокислот. Потім відокремлені білки проходять через поліакриламідний гель, забезпечуючи другий вимір, оскільки білки відокремлюються за розміром.

    Структурна протеоміка фокусується на тривимірній структурі білків, яка часто визначається білковим моделюванням, використовуючи комп'ютерні алгоритми для прогнозування найбільш ймовірного згортання білка на основі інформації про амінокислоти та відомих білкових закономірностей.

    Метаболоміка

    Метаболоміка прагне виявити повний набір метаболічних проміжних продуктів, що виробляються організмом. Це може бути надзвичайно складним, оскільки багато метаболітів використовуються клітинами декількома шляхами.

    Метагеноміка

    Метагеноміка або екологічна геноміка відноситься до вилучення об'єднаної ДНК безпосередньо з конкретного середовища, без початкової ізоляції та ідентифікації організмів у цьому середовищі. Оскільки багато видів мікробів важко культивувати в лабораторії, вивчення метагеному середовища дозволяє вченим розглянути всі організми, які можуть бути присутніми. Таксони можна навіть ідентифікувати за відсутності ізоляції організму лише за допомогою послідовностей нуклеїнових кислот, де таксон відомий як філотип.

    Ключові слова

    геноміка, секвенування, секвенування рушниці, геномна бібліотека, секвенування ДНК другого покоління, масово паралельні методи, секвенування ДНК третього та четвертого поколінь, біоінформатика, анотація генома, відкритий кадр читання/ORF, функціональний ORF, GenBank, інструмент пошуку Blast/Basic локального вирівнювання, порівняльна геноміка, геном ядра, пан геном, паралог, ортолог, функціональна геноміка, транскриптом, протеом, мікромарія/генні чіпи, зонд, протеоміка, функціональна протеоміка, двовимірний гелевий електрофорез, структурна протеоміка, метаболоміка, метагеноміка/геноміка навколишнього середовища, метагеном, філотип.

    Навчальні питання

    1. Що охоплює область геноміки?
    2. Що таке секвенування дробовика і як це дозволяє повністю секвенувати геном організму?
    3. Які основні відмінності між секвенуванням 2-го, 3-го та 4-го поколінь?
    4. Що таке відкрита рамка читання і як вчені можуть використовувати її для визначення інформації про геном і його продуктах?
    5. Чим функціональна геноміка відрізняється від порівняльної геноміки? Які інструменти використовуються в функціональній геноміці і яку інформацію можна отримати з кожного?