Обзор методов сЕквенирования

Введение

За десятилетия, прошедшие с разработки первого метода по секвенированию нуклеиновых кислот, метод по-настоящему эволюционировал в руках умелых исследователей. Одной из самых интересных и значимых глав в истории секвенирования стал проект "Геном человека". Он привел к экспоненциальному росту интереса к методике, а значит, ее развитию и коммерческому росту. Пионер среди метод — секвенирование по Сэнгеру, так называемый "золотой стандарт". Однако по мере развития появилась необходимость в более быстрых и экономичных способах анализа. Так возникли подходы к секвенированию второго поколения (NGS), а потом и третьего.

Теперь секвенирование доступно не только в узкоспециализированных лабораториях, но и в клиниках для оказания помощи пациентам. Результаты секвенирования помогают ставить диагнозы и лечить болезни, разрешать систематические споры ученых-биологов, воссоздавать историю жизни на планете, изучать обитателей окружающей среды и опасные патогены.

Но что же такое секвенирование? Это определение последовательности нуклеотидов в молекуле ДНК или РНК, или же последовательности аминокислот в белке. Действия, необходимые для расшифровки генетического кода, зависят от того, какой метод используется. В этом материале мы постараемся разобраться в том, как развивалось секвенирования и как устроен каждый из его типов.
Секвенирование по Сэнгеру — "золотой стандарт"
Начало настоящей эпохе геномных исследований было положено в 1977 году, именно тогда было разработано два метода секвенирования — Максама-Гилберта и Сэнгера. Остановимся подробнее на втором, так как он оказался более простым и точным и быстро стал наиболее распространенным методом, используемым до сих пор.

Секвенирование по Сэнгеру также называют методом обрыва цепи. Принцип заключается в синтезе новой цепи ДНК, комплементарной матричной цепи, с включением модифицированных меченых нуклеотидов, способных останавливать процесс синтеза. Первый этап метода включает в себя реакцию термоциклирования обрыва цепи, похожую на ту, которая происходит во время ПЦР. В раствор для секвенирования по Сэнгеру обязательно добавляют дидезоксинуклеотиды, помеченные флуоресцентным красителем, определенным для каждого основания [1].

Во время следующей фазы термоциклирования, ДНК-полимераза последовательно добавляет комплементарные дезоксинуклеотиды (dNTP) к синтезируемой цепи, до тех пор, пока не добавится дидезоксинуклеотид (ddNTP). Последнее событие случайно, но поскольку количество матриц на которых одновременно происходит реакция велико, то практически гарантировано, что помеченные дидезоксинуклеотиды присоединятся хотя бы раз к каждому из нуклеотидов анализируемой цепи ДНК.

После завершения второй фазы с присоединением ddNTP и обрывом дальнейшего синтеза, получившиеся фрагменты ДНК проходят через капилляр, содержащий полимерный гель. Чем меньше фрагменты ДНК, тем быстрее они проходят через через поры в полимере, тем самым отделяясь друг от друга. На конце капилляра детектор регистрирует краситель на ddNTP и выводит в виде хроматограммы. Так и определяется последовательность исходного образца ДНК. Благодаря современному ПО весь процесс автоматизирован и даже хроматограмму программа считает за исследователя.
    Секвенирование второго поколения

    С развитием технологии секвенирования для нее начали появляться новые прикладные задачи. Необходимо было увеличить пропускную способность и уменьшить финансовые затраты на секвенирование. Так возникло второе поколение модифицированных методик, которые частично справились с новыми задачами. Секвенирование второго поколения отличается высокой точностью, более низкой стоимостью и возможностью работы с фрагментированной ДНК. Еще одна отличительная особенность — короткие прочтения (примерно до 300 пар оснований).

    Секвенирование второго поколения часто разделяют на две категории: путем гибридизации и путем синтеза (SBS). Второе представляет собой следующий этап "развития" секвенирования по Сэнгеру.
    Секвенирование путем гибридизации

    Данный подход разработали в 1980-х. Исследователи использовали массив меченых фрагментов ДНК с уже известной последовательностью. Его наносили на фильтры, а затем добавляли анализируемую смесь фрагментов ДНК. Путем повторной гибридизации и вымывания не прореагировавших фрагментов, удавалось выяснить соответствуют ли анализируемые фрагменты меченым последовательностям на фильтре.

    Таким образом, можно было частично воссоздать последовательность на основе перекрывающихся фрагментов. Секвенирование путем гибридизации используют для выявления однонуклеотидных замен (SNP) в определенных генах, ассоциированных с некоей патологией. Помимо этого метод вполне может быть использован для обнаружения хромосомных аномалий [2, 3, 4]. Сейчас методика модифицирована и исследователи используют специальные ДНК-микрочипы.
    Секвенирование путем синтеза — Illumina

    Лидер по секвенированию путем синтеза — Illumina, около 90% данных GenBank получены именно благодаря секвенаторам, выпущенным этой компанией. После выделения ДНК библиотеку подготавливают путем фрагментации, очистки и амплификации образца. Затем, последовательность каждого из фрагментов считывается, а после — выравнивается на эталонный геном. Секвенирование параллельно протекает сразу для миллионов фрагментов ДНК.

    Обычно секвенирование Illumina делится на следующие этапы:

    • фрагментация ДНК;

    • добавление адаптеров;

    • денатурация ДНК;

    • иммобилизация ДНК;

    • амплификация ДНК;

    • секвенирование ДНК.
    Первые три этапа представляют собой подготовку библиотеки и о них мы подробнее поговорим в следующем материале. После того, как библиотека для секвенирования готова, образец добавляется в проточную кювету. До этого туда вносят раствор с короткими последовательностями ДНК — олигонуклеотидами, комплементарными адаптерам. Именно с них начинается считывание последовательности. После внесения образцов происходит один прогон амплификации для синтеза новой цепи на иммобилизованном фрагменте, остальное содержимое кюветы вымывается.

    Следующий шаг — создание кластера. Для этого проводят несколько циклов амплификации иммобилизованных фрагментов. По ходу дела они образуют мостики, которые отделяются друг от друга. В итоге в одной ячейке образуется около тысячи копий одного фрагмента. А вот теперь начинается собственно секвенирование — считывание последовательности. Для этого в кювету добавляется праймер, комплементарный адаптеру. Последующий процесс схож с классическим секвенированием по Сэнгеру. Фермент полимераза присоединяет к цепи нуклеотидов основания, но из-за того, что в основании отсутствует гидроксильная группа, реакция останавливается и происходит детекция присоединившегося основания для определения последовательности. Однако, в отличии от секвенирования по Сэнгеру, после гидроксильная группа восстанавливается, а флуоресцентный краситель удаляется [5].
    Секвенирование путем синтеза — GenoLab M

    Конкурентная Illumina платформа разработана компанией GeneMind Biosciences и представлена в 2020 году. Секвенатор GenoLab M использует метод секвенирования путем синтеза и обратимую терминацию. Результаты первого исследования, проведенного на секвенаторе GenoLab M представлены в 2021 году [6]. Полученные данные доказали, что новый секвенатор — многообещающая платформа для секвенирования геномов животных, растений и людей. Производительность прибора приравнивается к таковой у NovaSeq 6000 и NexSeq 2000 (Illumina), при этом стоимость секвенирования одного нуклеотида оказалась ниже [7].

    Давайте посмотрим, как проводится секвенирование на GenoLab M. Сперва библиотеку последовательностей денатурируют до одноцепочечной, после чего ее амплифицируют на поверхности проточной кюветы. Цикл секвенирования начинается после присоединения праймера к амплифицированным фрагментам, а также добавления нуклеотидов, меченных флуоресцентным красителем и полимеразы. Оптическая система обеспечивает детекцию сигнала от нуклеотидов. После общий пул полученных данных объединяется для цветовой коррекции и создания файлов для последующего анализа [6].
    Схема проведения секвенирования GenoLab M
    Секвенатор GenoLab M может работать с любыми библиотеками, которые совместимы с платформой Illumina. Как и секвенаторы Illimina, он подходит для широкого круга задач.
    Секвенирование с использованием наношариков BGI

    Китайская компания BGI Group, созданная в 1999 году для участия в проекте "Геном человека", разработала собственную методику секвенирования с использованием наношариков. В первую очередь, разработчики хотели вывести на рынок продукт, способный поддержать крупномасштабные проекты по секвенированию в области здравоохранения и клинических исследований. DNBSEQ может секвенировать до 800 000 образцов в год [8].

    Помимо программного обеспечения One Million Genomes Total Solution, секвенатор оснащен автоматизированной системой подготовки библиотек, что подразумевает круглосуточную автономную работу секвенатора без дополнительного вмешательства сотрудников лаборатории. DNBSEQ может завершать секвенирование около 60 полных геномов человека за один день [9].

    К концам двухцепочечной ДНК добавляются адаптеры, после чего система нагревается для денатурации и образования одноцепочечных молекул. Наношарики ДНК создаются следующим образом:
    • Сперва происходит гибридизация одноцепочечных молекул друг с другом — образуется кольцо, которое служит матрицей для амплификации.
    • Затем фрагменты ДНК различных размеров амплифицируются для создания до 1000 копий, которые образуют подобие шариков. Происходит это путем репликации по типу катящегося кольца [10].

    Во время секвенирования используется ДНК-полимераза Phi-29 высокой точности, что позволяет свести процесс возникновения ошибок во время амплификации к минимуму [11]. Наношарики прикрепляются к проточной ячейке с кремниевой пластиной, где они избирательно связываются с положительно заряженным материалом поверхности пластин. Как и в других подходах, детекция становится возможна благодаря использованию флуоресцентного красителя. После секвенирования первой цепи добавляются праймеры и полимераза для второй цепи. Определение последовательности происходит за счет многократного лигирования [12]. Такой подход позволяет экономно секвенировать большое количество последовательностей наношариков ДНК за цикл [13].
    Схема проведения секвенирования с использованием ДНК-наношариков BGI
    Секвенаторы BGI представлены несколькими моделями. Так, модель DNBSEQ-G400 предназначена для полногеномного секвенирования, другая модель секвенатора послужит для полноэкзомного секвенирования.
    Секвенирование третьего поколения

    Методы секвенирования третьего поколения отличаются возможностью делать длинные прочтения (риды), что важно при секвенировании генома. Самые известные сферы применения — изучение эпигенетических маркеров, транкримтомов и метагеномных данных. Помимо длинных ридов определенное преимущество — упрощенная подготовка библиотеки и портативность устройств. Но все же методы секвенирования третьего поколения отмечены более низким качеством прочтений и высокой, по сравнению с NGS, вероятностью ошибок.

    Самые известные секвенаторы третьего поколения представили две компании — Pacific Biosciences и Oxford Nanopore Technologies.
    Нанопоровое секвенирование

    Первое устройство, в основе которого лежал новый подход к секвенированию, было представлен в 2014 году. MinION — портативное устройство, для которого относительно просто можно подготовить образцы. Работать на нем можно как ДНК, так и РНК [14]. Однако, сперва частота ошибок анализатора составляла до 30% и необходимо было усовершенствовать технологию. В 2020, по данным производителя, удалось достигнуть точности в 99,9%. Благодаря этому устройство удобно использовать для идентификации вирусных патогенов. Улучшение характеристик пришлось как никогда кстати. Помимо патогенов, на MinION можно определять мутации при раке и других патологиях.

    При анализе на МinION молекула ДНК проходит через нанопору, находящуюся под действием ионного тока. Перед этим готовится библиотеки, которая несколько отличается от библиотеки для секвенаторов второго поколения, так адаптеры в этом случае должны впоследствии взаимодействовать с моторным белком нанопоры, а не праймерами и полимеразой. По мере движения молекулы через поры меняется электрический заряд, что фиксируется специальными детекторами. Нанопоры образованы белком phi29, который проводит цепь ДНК, словно нитку через ушко иголки. Кстати, ошибка в секвенировании зачастую происходит из-за того, что через пору проходит одновременно несколько нуклеотидов. Более высокой точности можно достигнуть за счет замедления прохождения молекулы через нанопору, а также за счет многократного секвенирования одного и того же фрагмента.
    PacBio

    Первый секвенатор компания Pacific Biosciences представила в 2010 году. Также, как и при нанопоровом секвенировании, приборы PacBio генерируют длинные прочтения. Однако компания не стала пренебрегать более классическими секвенаторами с короткими ридами и создала платформу Onso [15].

    Подход к секвенированию от PacBio носит название SMRT (Single molecule real time sequencing), или одномолекулярное секвенирование в реальном времени [16]. Одна ячейка прибора содержит миллионы еще более крошечных ячеек, или лунок. Одиночные молекулы ДНК крепятся на дне лунок, в то время как ДНК-полимераза начинает присоединять нуклеотиды с флуоресцентными метками. Добавление каждого комплементарного исходной цепи основания считывается детектором прибора.

    Ошибка при считывании может достигать 15% и происходит из-за низкого уровня сигнала от каждого отдельного присоединенного основания. Это происходит по большей части из-за того, что оно основание присоединяется быстрее, чем система успевает регистрировать сигнал. Большая часть ошибок нивеллируется за счет многократного секвенирования одного и того же фрагмента. Модификации метода за последние годы позволили значительно увеличить точность секвенирования приборами PacBio.
    Заключение
    Секвенирование — один из основных методов получения информации о структуре и последовательности нуклеотидов в геноме организмов . Существует несколько технических методов, позволяющих получать и обрабатывать данные секвенирования.
    Одним из первых был использован метод, основанный на химической ️обработке ДНК. Он позволял получать информацию о порядке нуклеотидов в ДНК, но имел некоторые ограничения. В частности, требовал большое количество исходного материала и достаточно длительное время для обработки информации.

    Впоследствии появились технологии, основанные на использовании ферментативной обработки ДНК . Одним из них был метод полимеразной цепной реакции (ПЦР), позволяющий получать множество копий исследуемого участка ДНК . Он дал дополнительные возможности для секвенирования и существует до сегодняшнего дня.

    В последнее время появились новые методы секвенирования, позволяющие получать большие объемы данных за короткий промежуток времени. Один из таких методов называется методом "нового поколения" (NGS). Он основан на параллельном секвенировании миллиардов коротких фрагментов ДНК . Этот метод позволяет получать информацию о последовательности нуклеотидов в исследуемом геноме с высокой точностью и в кратчайшие сроки.

    В процессе секвенирования полученные данные обрабатываются и анализируются с помощью специальных программ и алгоритмов. Это позволяет установить связь между последовательностью нуклеотидов и конкретными генетическими признаками организма. Методы секвенирования широко используются в медицине, в том числе для диагностики ️и установления ️причин развития генетических заболеваний.

    Секвенирование — мощный инструмент для получения информации о структуре и последовательности ДНК. Оно позволяет находить ответы на большое количество вопросов, связанных с генетикой и биологией организмов, и способствует развитию науки и медицины.

    Когда в важной для человека сфере практического применения (например, в здравоохранении) есть конкуренция, технологии и методы стремительно развиваются. Разный подход, поиск новых приложений, стремление сделать анализ более точным и доступным, привели к появлению нескольких успешных подходов к секвенированию, с которыми мы познакомились в этой статье.
    Источники

    1. Slatko B. E., Gardner A. F., Ausubel F. M. Overview of next‐generation sequencing technologies //Current protocols in molecular biology. – 2018. – Т. 122. – №. 1. – С. e59.
    2. Church G. M. Genomes for all //Scientific American. – 2006. – Т. 294. – №. 1. – С. 46-55.
    3. Mirzabekov A. D. DNA sequencing by hybridization—a megasequencing method and a diagnostic tool? //Trends in biotechnology. – 1994. – Т. 12. – №. 1. – С. 27-32.
    4. Qin Y., Schneider T. M., Brenner M. P. Sequencing by hybridization of long targets //PloS one. – 2012. – Т. 7. – №. 5. – С. e35819.
    5. Meszaros E., DNA sequencing methods: from Sanger to NGS / Inegra.
    6. Li C. et al. Accuracy benchmark of the GeneMind GenoLab M sequencing platform for WGS and WES analysis //BMC genomics. – 2022. – Т. 23. – №. 1. – С. 1-11.
    7. Pavel I. et al. Comparison of the Illumina NextSeq 2000 and GeneMind Genolab M sequencing platforms for spatial transcriptomics //BMC genomics. – 2023. – Т. 24. – №. 1. – С. 102.
    8. Mobley I., DNA Sequencing: How to Choose the Right Technology / Front line genomics. Электронный ресурс URL: https://frontlinegenomics.com/
    9. Introduction in MGI sequencing technology / MGI. Электронный ресурс URL: https://en.mgi-tech.com/
    10. Rolling circle replication / Wikipedia. Электронный ресурс URL: https://en.wikipedia.org/
    11. Li X. Y. et al. Dual functional Phi29 DNA polymerase-triggered exponential rolling circle amplification for sequence-specific detection of target DNA embedded in long-stranded genomic DNA //Scientific Reports. – 2017. – Т. 7. – №. 1. – С. 1-10.
    12. Drmanac R. et al. Human genome sequencing using unchained base reads on self-assembling DNA nanoarrays //Science. – 2010. – Т. 327. – №. 5961. – С. 78-81.
    13. Porreca G. J. Genome sequencing on nanoballs //Nature biotechnology. – 2010. – Т. 28. – №. 1. – С. 43-44.
    14. MinION / Oxford Nanopore Technologies. Электронный ресурс URL: https://nanoporetech.com/
    15. ONSO System / PacBio. Электронный ресурс URL: https://www.pacb.com/
    16. SMRT Analysis Software / PacBio. Электронный ресурс URL: https://www.pacb.com/ [

    Смотрите также