Ученые, исследующие сложные механизмы регуляции генов, участвующие в здоровых и нарушенных биологических процессах, теперь имеют в своем арсенале новый инструмент – EUGENe. Исследователи из University of California и других университетов мира разработали ПО с моделью глубокого обучения, которое, по их утверждению, можно адаптировать для работы в различных проектах в области геномики. Результаты исследования представлены в журнале Nature Computational Science.
Глубокое обучение, безусловно, не является чем-то новым в геномике. Например, эта технология успешно использовалась для обнаружения мотивов связывания белков ДНК и РНК и для прогнозирования состояний хроматина и транскрипционной активности. Но разработка и внедрение рабочих процессов на основе глубокого обучения для исследований в области геномики всегда были сложной задачей даже для опытных исследователей.
Ученые могут использовать ПО для изучения различных свойств рассматриваемой последовательности и того, что происходит, когда в ней что-то меняется. Исследователи подвергли EUGENe испытаниям, пытаясь воспроизвести результаты трех исследований в области геномики, в которых используются различные типы данных секвенирования. Эти наборы данных получены на основе анализа растительных промоторов, данных о специфичности РНК-связывающих белков и данных ChIP-секвенирования в рамках проекта ENCODE. Анализ различных типов данных обычно требует смешивания и сопоставления нескольких технологических платформ. Однако ученым удалось успешно адаптировать EUGENe к каждому типу данных и воспроизвести результаты исследований.
На данный момент ПО работает с данными ДНК и РНК. Ученые планируют развить его, включив в пул возможных данных для анализа новые типы данных, такие как секвенирование отдельных клеток.
Глубокое обучение, безусловно, не является чем-то новым в геномике. Например, эта технология успешно использовалась для обнаружения мотивов связывания белков ДНК и РНК и для прогнозирования состояний хроматина и транскрипционной активности. Но разработка и внедрение рабочих процессов на основе глубокого обучения для исследований в области геномики всегда были сложной задачей даже для опытных исследователей.
Ученые могут использовать ПО для изучения различных свойств рассматриваемой последовательности и того, что происходит, когда в ней что-то меняется. Исследователи подвергли EUGENe испытаниям, пытаясь воспроизвести результаты трех исследований в области геномики, в которых используются различные типы данных секвенирования. Эти наборы данных получены на основе анализа растительных промоторов, данных о специфичности РНК-связывающих белков и данных ChIP-секвенирования в рамках проекта ENCODE. Анализ различных типов данных обычно требует смешивания и сопоставления нескольких технологических платформ. Однако ученым удалось успешно адаптировать EUGENe к каждому типу данных и воспроизвести результаты исследований.
На данный момент ПО работает с данными ДНК и РНК. Ученые планируют развить его, включив в пул возможных данных для анализа новые типы данных, такие как секвенирование отдельных клеток.