Skip to main content
LibreTexts - Ukrayinska

1: Ортологія/Паралогова лабораторія

  • Page ID
    3354
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    Для цього завдання ви перетворите своє вирівнювання, своє дерево, імена пари ортологов, імена пари паралогів, а також короткий опис значущості обраного вами гена. Додатково у вас буде «Додаток» з позначками по кроках (якщо щось сталося на кроці, який не був описаний в інструкції, якщо ви помітили щось цікаве).

    ІНСТРУКЦІЇ

    Отримання вашого набору послідовностей

    1. Отримайте свої послідовності «приманки».
      1. Перейдіть до Uniprot і введіть назву YFG + модельний вид (наприклад, якщо ви зацікавлені в генах сороконіжки в кінцевому рахунку, ви б поставили дрозофілу). Читайте трохи про ваш ген і прокрутіть вниз до FASTA. Натисніть на це, і він перенесе вас на FASTA відформатований білок послідовності.
        1. Якщо існує більше однієї «версії» YFG для цього виду, отримайте FASTA для всіх них - вони, швидше за все, гомологи. Наприклад, дивлячись на Dlx (Distalless у хребетних) я знаходжу версію 5 у людей. Так що я б отримати FASTA для кожного з них. Помістіть все це в одному текстовому документі.
    2. Отримайте послідовності «моделі». Дотримуйтесь тих же інструкцій для двох інших (або трьох) моделей. Якщо у вас виникли проблеми з вибором моделей, ви можете попросити мене про допомогу! Додайте їх до текстового документа FASTA.
    3. Отримайте свої «тестові» послідовності
      1. Вибух вашої послідовності «приманки» в NCBI вибуху. Обмежте пошук своїми тестовими видами, це допоможе, якщо ви знаєте наукову назву (у Вікіпедії це є). Виберіть послідовності зі значенням менше 1e-10. Якщо їх занадто багато, просто виберіть топ-5. Якщо немає жодного з оцінкою цього низького рівня, виберіть топ-3. Додайте їх до текстового документа FASTA.
    4. Отримайте послідовність «поза групою»
      1. Це повинна бути послідовність, схожа на YFG, але не гомологічна. Щоб знайти його, поверніться до UniProt і натисніть BLAST. Вставте в послідовність приманки і виберіть базу даних UniRef50 з випадаючого меню і натисніть запустити. Зачекайте.
      2. Прокрутіть список результатів вниз, поки не почнете бачити імена генів, які відрізняються від YFG. Натисніть на високий бал один з них і отримаєте послідовність FASTA, додайте це до вашого текстового документа FASTA в самому верху.

    Робимо своє дерево

    Наступним кроком є вирівнювання послідовностей і створення дерева. Вирівнювання послідовностей розміщує найбільш схожі частини кожної послідовності у вертикальних стовпчиках. Це полегшує візуально побачити, чи дійсно послідовності дуже схожі чи не так багато. Іноді ви також можете побачити такі речі, як збережені домени у вирівнюванні. Інша корисна річ про вирівнювання полягає в тому, що вони можуть бути використані для оцінки подібності статистичними алгоритмами. Ці програми використовують вирівнювання для виведення філогенетичних відносин.

    1. Вставте свою послідовність у форматі FASTA в https://www.ebi.ac.uk/Tools/msa/muscle/ і виберіть Pearson/Fasta як ваш вихід. Вихід важливий, тому що нам потрібен вихідний файл, який може прочитати наступна програма.
    2. Сторінка результатів має купу різних варіантів. Збережіть базову текстову версію, а потім клацніть навколо, щоб по-різному візуалізувати вирівнювання. Бачите щось цікаве? Будь-які візерунки?
    3. Завантажте цей «файл вирівнювання» на http://iqtree.cibiv.univie.ac.at. і натисніть відправити вакансію. IQTree за замовчуванням перевірятиме різні моделі молекулярної еволюції на ваших даних і подивиться, яка з них підходить. Ми не збираємося використовувати супер фантазії моделі, тому нам не потрібно додавати такі речі, як гамма-розподіл або гетерогенність вільної швидкості. Коли IQTree працює, ви можете обміркувати різницю між паралогами та ортологами та/або почати писати опис вашого гена та те, що відбувалося на кожному кроці, який ви робили, щоб дізнатися про генетичну складність у вашому немодельному організмі.
    Еводево Tree.png

    Зразок виводу Хен Чжу Кім та Кінсей Імада

    Це дерево прагне з'ясувати, чи має ген сімейства Drosophila Distalless INDY (Я ще не мертвий) гомолог у спорідненої комахи, Folsomia candida (FOLCA).

    Людські паралоги в коробці червоного кольору. Найближчим родичем цього дерева до Drosophila INDY (XP_009059854.1) є ген молюска (ортологи в коробці червоного кольору). Ген FOLCA потрапляє в той же клад, що і Drosophila INDY, припускаючи, що це може бути гомолог INDY.

    У блакитному кольорі знаходяться людські і дрозофіли представники родового генного дублювання події.