Основные приложения секвенирования в науке и медицине

Введение

Роль секвенирования в науке и медицине с каждым годом только растет. Уже сложно представить генетическую лабораторию без секвенатора. Его используют для проведения фундаментальных исследований, например, расшифровки генома любого из живущих на планете видов. Также, прикладные задачи секвенирования включают в себя диагностику патологий, определение особенностей раковых опухолей, селекции и многого другого. Так какие же разновидности секвенирования существуют в настоящее время и для чего они используются?

Полногеномное секвенирование

Полногеномное секвенирование (whole genome sequencing, WGS) — определение всей последовательности геномной ДНК за один раз. Вместе с геномной ДНК секвенируют и ДНК митохондрий, а если речь идет о растениях — то и хлоропластов. На выходе ученые получают смесь из фрагментов (ридов) всего генома организма [1].


Полногеномное секвенирование можно использовать как для создания эталонной последовательности (той, которую затем будут использовать в качестве образца для сравнения), так и для анализа конкретного генома организма. WGS позволяет определять разные типы биомаркеров ДНК: однонуклеотидные полиморфизмы (SNP) — точечные мутации; вставки или делеции участков последовательности (indels); структурные вариации (SV); вариации числа копий (CNV) и другие варианты изменений в последовательности. Также WGS часто применяют для поиска полиморфизма внутри популяции, что позволяет подробнее изучить развитие и эволюцию вида. Помимо этого, WGS применяют при проведении GWAS — полногеномного поиска ассоциаций. Он проводится, когда необходимо выявить связь конкретного изменения в геноме с определенным фенотипом. Помимо этого GWAS используют в сельском хозяйстве, фармацевтике, персонализированной медицине и при оценке пищевой безопасности.

WGS обладает следующими преимуществами:

  • позволяет охарактеризовать мутации по всей последовательности, если есть эталонный геном,
  • провести популяционный анализ и филогенетическое исследование,
  • изучить ассоциации мутаций с определенными заболеваниями,
  • использовать полученные данные в разработке лекарственных препаратов, а также для персонализированной медицины.
    Полноэкзомное секвенирование

    Кодирующая часть генома — экзом — составляет всего около 1,7% всей последовательности ДНК. При этом 85% мутаций, вызывающих заболевания, происходят именно в экзоме. Поэтому его секвенирование предоставляет больше достоверных данных при исследовании определенных вариантов наследственных мутаций или изменений, которые можно задействовать в селекции для улучшения сельскохозяйственных культур, чем секвенирование всего генома [2].

    Для секвенирования экзома в качестве способа выделения целевой ДНК используется таргетное обогащение. Как и в случае с обычным секвенированием, сначала следует фрагментация выделенной ДНК, а затем создание библиотеки с обязательным таргетным обогащением.

    По сравнению с WGS, полноэкзомное секвенирование дешевле и надежнее, так как глубина прочтений увеличивается из-за меньшей длины общей последовательности. Выходные данные получаются меньше по объему, оттого и анализ их проходит быстрее и проще. Также, как и WGS, полноэкзомное секвенирование используют в медицинских, исследовательских и сельскохозяйственных целях. Для изучения редких менделеевских заболеваний секвенирование экзома — наиболее эффективный способ выявления генетических вариантов.


    Таргетное секвенирование ДНК

    Таргетное секвенирование, в отличии от секвенирования всего генома (WGS) и секвенирования экзома (WES), помогает расшифровать последовательность определенных генов или мишеней, ассоциированных с патологией. Таким образом, таргетное секвенирование предлагает определение последовательности с меньшими затратами и при этом с большей глубиной покрытия для анализа конкретных участков генома. Такой вариант секвенирования подразумевает меньшую длину определяемой последовательности, чем полноэкзомное. Таргетное секвенирование отлично подходит в случае работы с ДНК низкого качества. Именно поэтому этот тип определения последовательности широко используется в диагностике или для разработки терапевтических средств.
    Сравнение полногеномного, полноэкзомного и таргетного секвенирования. Источник: [3].
    Например, таргетное секвенирование используется для определения мутаций в таких генах, как KRAS и TP53, которые часто становятся одним из факторов развития некоторых типов онкологии [4, 5]. Большая глубина секвенирования делает таргетное секвенирование очень эффективным для профилирования клинических образцов. Особенно это касается опухолевых образцов, где целевая последовательность чаще всего представлена в очень низких концентрациях.

    Таргетное секвенирование стало возможно после разработки таргетного обогащения, которое чаще всего осуществляется при помощи амплификации целевых фрагментов генома или на основе гибридизации. При этом обогащение при помощи амплификации более бюджетно, но равномерность покрытия при этом ниже, чем при обогащении на основе гибридизации [6].

    Таблица 1

    Сравнение полногеномного, полноэкзомного и таргетного секвенирования. Источник: [7].
    Таргетное секвенирование РНК

    Таргентное секвенирование работает и с РНК — при этом исследуются именно целевые последовательности. Этот подход позволяет точно определить активен ли определенный ген в конкретной ткани в текущий момент. Подобный подход обеспечивает высокую точность и экономичность по сравнению с секвенированием всего транскриптома — совокупной последовательности всей РНК клетки или ткани [8]. Метод позволяет определять экспрессию конкретных белков количеством от десятков до нескольких тысяч.

    Данные, полученные при помощи таргетного секвенирования РНК, позволяют получить информацию для анализа дифференциальной экспрессии — перемен в активности генов, обратимых и связанных с конкретным состоянием, экспрессии определенных аллелей. Также можно определять наличие генетических патологий и реакцию пациента на терапию. Секвенирование транскриптома рака дает ценную информацию об изменениях в экспрессии генов в опухолях.
    Метагеномный и метатранскриптомный анализ

    Метагеномика изучает ДНК группы определенных видов, что чаще всего применяется для анализа состава микробных сообществ. Это позволяет изучать поведение сообщества организмов, находящихся в схожем состоянии или одной среде. Чаще всего метагеном анализируют методом микрочипов, который позволяет выявить присутствие конкретных видов в образце. Такой подход можно использовать как в медицинских целях, например для анализа кишечной микрофлоры, так и при изучении микробного состава водоема или, допустим, йогурта.

    После секвенирования метагенома проводят выравнивание последовательностей для обнаружения фрагментов генома определенных видов. После выравнивания филогенетическое дерево показывает отношения каждого организма в сообществе и детали его поведения.

    Схема метагеномного секвенирования. Источник: [9].
    Метатранскриптомика изучает РНК организма (транскриптом), которые образуются при реализации генетической информации. Анализ транскриптома позволяет выяснить, какие именно гены активны в тех или иных тканях организма. В свою очередь, метатранскриптомика — это анализ нескольких транскриптомов в популяциях или сообществах.

    Для подобного анализа также чаще всего используются микрочипы. Однако, область метатранскриптомики намного сложнее по сравнению с метагеномикой. Извлечь мРНК или РНК в целом не так просто, как кажется. Дело в том, что РНК очень легко разрушается, а ее выделение и хранение требуют определенных условий [10].

    Секвенирование метилома

    Технологии секвенирования изменили не только подход исследователей к классической генетике, но и к области эпигенетики. Эпигенетика — раздел генетики, изучающий наследуемые изменения ДНК, которые не затрагивают последовательность нуклеотидов. Эпигенетические метки представляют собой присоединенные к конкретному нуклеотиду функциональные группы, влияющие на активность того участка, на котором располагаются. Эпигенетика во многом рассказывает о влиянии окружающей среды и питания организма на его геном. Современные методы позволяют обнаружить эпигенетические особенности генома с точностью до одного нуклеотида [11].

    Метилирование ДНК — наиболее изученная эпигенетическая метка, участвующая в различных процессах в клетке человека, к ним относятся:

    • регуляция генов,
    • геномный импринтинг — особенности активности гена в зависимости от того, от какого из родителей он унаследован,
    • эмбриональное развитие
    • модификация структуры хроматина,
    • развитие ряда заболеваний, например, рака [12].
    Метилирование ДНК представляет собой ковалентную модификацию цитозиновых нуклеотидов, обычно расположенных на паре нуклеотидов цитозин-гуанин [13]. Химическая реакция проводится группой специальных белков, называемых ДНК-метилтрансферазами [14].


    В качестве экспериментальных методов обнаружения метилирования ДНК используются ферменты рестрикции, способные "разрезать" ДНК в необходимых исследователям местах; аффинное обогащение — присоединение специальных молекул к интересующему участку и бисульфитная конверсия — процесс замены цитозина на урацил [15, 16]. В случае превращения цитозина в урацил, ученые понимают, что данный нуклеотид не метилирован.

    Исследование метилома можно проводить по всему геному или же только на интересующем фрагменте последовательности. На текущий момент наиболее распространенный метод для анализа метилирования ДНК — бисульфитная конверсия [17, 18].


    Заключение

    Развитие методов секвенирования приводит к закономерному росту возможностей использования полученных данных. Помимо фундаментальных исследований, для которых чаще всего используют полногеномное исследование, в медицине удобно применять полноэкзомное или таргетное секвенирование. В свою очередь, метагеномное или меатранскримптомное отлично подойдут для исследования микробиома, этот анализ в последние годы становится все более и более востребован.
    Полногеномная библиотека с бисульфитной конверсией

    Полногеномное секвенирование с использованием бисульфита натрия предоставляет наиболее полные и точные данные метилирования ДНК [16]. Именно поэтому, в случае необходимости изучить метилом генома, библиотека для секвенирования подготавливается определенным образом — с бисульфитной конверсией.

    При подготовке библиотеки неметилированный цитозин в ДНК подвергают модификации, используя бисульфитную соль [17]. Бисульфит вступает в реакцию с неметилированным цитозином превращая его в урацил, который при проведении ПЦР амплифицирует в виде тимина. В свою очередь, метилированные цитозины остаются неизмененными. Таким образом при секвенировании можно с большим уровнем точности отследить эпигенетические изменения генома.
    Автоматизация создания библиотек

    Рабочие станции для выделения нуклеиновых кислот порой могут быть использованы и для подготовки библиотеки. При достаточно масштабной работеих использование значительно сокращает время, сохраняя высокую точность [18]. Например, робот Opentrons OT-2, способен выполнять большинство шагов даже сложных рабочих процессов с минимальным вмешательством сотрудника лаборатории.
    Заключение

    Подготовка библиотеки, подобно другим этапам секвенирования, требует модификаций протокола подготовки образцов под конкретную задачу. В зависимости от того, планирует исследователь изучить метилом, отследить определенные мутации или собрать эталонный геном, разнятся и методы, реактивы и оборудование.

    Тем не менее, мы выяснили, что подготовка библиотеки включает в себя несколько основных этапов: фрагментацию, репарацию концов фрагментов, присоединение адаптеров и проверку качества и концентрации. Во многом от того, насколько правильно будет выбран подход для создания библиотеки и какого качества она получится, зависит и итоговый результат NGS.
    Источники

    1. "Whole Genome Sequencing", CD Genomics (URL: https://www.cd-genomics.com/)
    2. "Whole Exome Sequencing", CD Genomics (URL: https://www.cd-genomics.com/)
    3. Shin Y.-J. "WES WGS Panels: Which is the best NGS approach?", 3billion (URL: https://3billion.io/index)
    4. Lochhead P. et al. Microsatellite instability and BRAF mutation testing in colorectal cancer prognostication //Journal of the National Cancer Institute. – 2013. – Т. 105. – №. 15. – С. 1151-1156.
    5. Hodis E. et al. A landscape of driver mutations in melanoma //Cell. – 2012. – Т. 150. – №. 2. – С. 251-263.
    6. Samorodnitsky E. et al. Evaluation of hybridization capture versus amplicon‐based methods for whole‐exome sequencing //Human mutation. – 2015. – Т. 36. – №. 9. – С. 903-914.
    7. Bewicke-Copley F. et al. Applications and analysis of targeted genomic sequencing in cancer studies //Computational and structural biotechnology journal. – 2019. – Т. 17. – С. 1348-1359.
    8. Mercer T. R. et al. Targeted RNA sequencing reveals the deep complexity of the human transcriptome //Nature biotechnology. – 2012. – Т. 30. – №. 1. – С. 99-104.
    9. "Amplicon and metagenomics overview", Happy Belly Bioinformatics (URL: https://astrobiomike.github.io/)
    10. Aguiar-Pulido V. et al. Metagenomics, metatranscriptomics, and metabolomics approaches for microbiome analysis: supplementary issue: bioinformatics methods and applications for big metagenomics data //Evolutionary Bioinformatics. – 2016. – Т. 12. – С. EBO. S36436.
    11. Rauluseviciute I., Drabløs F., Rye M. B. DNA methylation data by sequencing: experimental approaches and recommendations for tools and pipelines for data analysis //Clinical epigenetics. – 2019. – Т. 11. – №. 1. – С. 1-13.
    12. Yong W. S., Hsu F. M., Chen P. Y. Profiling genome-wide DNA methylation //Epigenetics & chromatin. – 2016. – Т. 9. – №. 1. – С. 1-16.
    13. Dor Y., Cedar H. Principles of DNA methylation and their implications for biology and medicine //The Lancet. – 2018. – Т. 392. – №. 10149. – С. 777-786.
    14. Long M. D., Smiraglia D. J., Campbell M. J. The genomic impact of DNA CpG methylation on gene expression; relationships in prostate cancer //Biomolecules. – 2017. – Т. 7. – №. 1. – С. 15.
    15. Barros-Silva D. et al. Profiling DNA methylation based on next-generation sequencing approaches: new insights and clinical applications //Genes. – 2018. – Т. 9. – №. 9. – С. 429.
    16. Bock C. Analysing and interpreting DNA methylation data //Nature Reviews Genetics. – 2012. – Т. 13. – №. 10. – С. 705-719.
    17. Frommer M. et al. A genomic sequencing protocol that yields a positive display of 5-methylcytosine residues in individual DNA strands //Proceedings of the National Academy of Sciences. – 1992. – Т. 89. – №. 5. – С. 1827-1831.
    18. Harrison A., Parle-McDermott A. DNA methylation: a timeline of methods and applications //Frontiers in genetics. – 2011. – Т. 2. – С. 74.