В России создана база данных из 100 тысяч секвенированных геномов
В России собрана одна из крупнейших баз полногеномных данных, объем которой на октябрь 2025 года составляет 100 тысяч геномов. Работа проводилась по национальной генетической инициативе «100 000 Я». Проект направлен на развитие молекулярной диагностики и персонализированной медицины. Реализуется инициатива компанией «Биотехнологический кампус». Она отвечает за проведение полногеномного секвенирования, хранение и анализ данных. Одним из ключевых медицинских партнеров проекта, обеспечивающим клиническую интерпретацию результатов и сопровождение пациентов, выступает Медико-генетический научный центр (МГНЦ) им. академика Н.П. Бочкова. Ранее сообщалось, что проект будет профинансирован «Роснефтью» на сумму более 20 млрд рублей.
Начальник информационно-аналитического отдела МГНЦ Оксана Рыжкова отметила, что каждый новый геном добавляет знания о вариабельности и механизмах наследственных болезней, а сама база становится национальным научным ресурсом и основой для персонализированной медицины будущего.
Половина базы содержит данные здоровых участников из разных регионов страны, другая – геномы пациентов медицинских учреждений. Такое сочетание, считают ученые, позволяет изучать генетическое разнообразие населения и применять полученные данные для диагностики наследственных заболеваний.
Накопленные данные уже используются для диагностики наследственных заболеваний и уточнения причин редких клинических случаев. Так, МГНЦ направил на полногеномное секвенирование более 20 тысяч образцов, собранных у 12 тысяч пациентов и членов их семей. Треть из них уже прошла полный цикл анализа – от секвенирования до клинического заключения. По данным центра, полногеномные исследования позволили установить точный диагноз у 29% пациентов, выявить варианты неопределенного клинического значения у половины и обнаружить сочетания двух и более наследственных болезней. Эксперты уточнили, что в научных работах частота таких случаев оценивается в 1–5% от общей популяции.
В ходе работы над базой также были впервые в России диагностированы CHD2-ассоциированное нарушение развития нервной системы (всего в мире описано около 300 подобных случаев), мандибулофациальный дизостоз Гион-Алмейда (около 200 зафиксированных случаев в мире), синдром Снейдерса Блока-Кампо (90 диагнозов в мире). Помимо этого, полногеномное секвенирование позволило выявить у 2,7% здоровых участников проекта вторичные находки, которые свидетельствуют о рисках развития у пациентов рака молочной железы, других видов злокачественных новообразований, сердечно-сосудистых заболеваний и метаболических болезней.
У 30% здоровых участников были выявлены патогенные варианты наиболее распространенных рецессивных наследственных заболеваний. Как пояснил генеральный директор «Биотехнологического кампуса» Константин Северинов, носители остаются здоровыми, поскольку для развития болезни в геноме должны быть две копии поврежденного гена, однако если второй супруг также окажется носителем патогенного варианта в том же гене, с вероятностью одна четвертая будет рожден больной ребенок.
При сборе данных, уточнили Vademecum в «Биотехнологическом кампусе», используется технология DNBSEQ китайской компании MGI, сопоставимая по точности и производительности с ведущими международными платформами. Все данные хранятся и обрабатываются в собственном дата-центре «Биотехнологического кампуса». Обработка персональных данных, подчеркивают представители компании, осуществляется строго в соответствии с законодательством, на основании письменных согласий участников. Геномные данные обезличены, доступ к ним имеют лишь специально уполномоченные сотрудники.
По словам Северинова, проект нацелен не только на накопление данных, но и на создание надежной инфраструктуры для защиты информации и научного обмена. В ближайшие годы инициативу «100 000 Я» планируется развивать – расширять выборку, совершенствовать технологии анализа и обеспечивать доступ к статистическим данным для исследователей и медицинских организаций.
Финансовую поддержку проекта обеспечивает «Роснефть», выступающая технологическим партнером Федеральной научно-технической программы развития генетических технологий. Ранее, на III Конгрессе молодых ученых в Университете «Сириус» в ноябре 2023 года, президент России Владимир Путин сообщил, что «Роснефть» планирует направить до 20 млрд рублей на исследования в сфере генетики. Премьер-министр Михаил Мишустин в июне 2025 года поручил вице-премьеру Татьяне Голиковой заключить с «Роснефтью» дополнительное соглашение, направленное на ускорение реализации федпрограммы, в том числе инициатив, связанных с развитием генетических технологий и полногеномного секвенирования.
Работы по формированию базы ведутся с конца 2022 года. Первые массовые взятия крови начались в марте 2023 года, а первая тысяча геномов была получена уже в апреле того же года. Над созданием ресурса почти три года работали более двадцати партнерских организаций. Среди них – НМИЦ детской гематологии, онкологии и иммунологии им. Дмитрия Рогачева, Городская клиническая больница № 52, НМИЦ онкологии им. Н.Н. Петрова, Томский НИМЦ, НМИЦ колопроктологии им. А.Н. Рыжих, ФНКЦ ФМБА России, Российский геронтологический научно-клинический центр, а также Роспотребнадзор. К международным партнерам инициативы относятся Qatar Precision Health Institute (Катар), Reliance Industries Limited (Индия) и Strand Life Sciences (Индия).
Ранее МГНЦ совместно со Смоленским и Самарским государственными медицинскими университетами представил платформу AMRcf, предназначенную для наблюдения за состоянием микробиома у пациентов с муковисцидозом. На ней собраны результаты микробиологических анализов 200 пациентов из 16 регионов России за 2018-2025 годы. Сервис позволяет врачам отслеживать динамику изменений микробиоты дыхательных путей, анализировать антибиотикорезистентность и принимать решения о корректировке терапии. В дальнейшем база AMRcf может быть объединена с национальным регистром пациентов с муковисцидозом, который ведет МГНЦ.
Vademecum