Искусственный интеллект открыл 70 500 новых РНК-вирусов

Искусственный интеллект открыл 70 500 новых РНК-вирусов, используя метагеномику для анализа геномных данных без культивирования. Новая модель LucaProt выявила около 160 000 вирусов, включая уникальные, найденные в экстремальных условиях. Исследования продолжаются для определения хозяев вирусов и понимания их экологии
Новости 2024 10 31

Искусственный интеллект открыл 70 500 новых РНК-вирусов

С использованием методов искусственного интеллекта ученые сделали удивительное открытие, выявив 70 500 новых РНК-вирусов, которые ранее не были известны науке. Эти вирусы выделяются своей необычностью и отсутствием аналогов среди известных видов. Основной метод, использованный для их идентификации, — метагеномика. Этот подход позволяет без необходимости в культивировании отдельных вирусов анализировать все геномы, присутствующие в окружающей среде. Благодаря этому исследованию открывается новый горизонт для изучения так называемой «темной материи» вирусов, что подчеркивает огромный потенциал ИИ в этой области. Такие находки могут помочь в понимании вирусной биологии и экологии, позволяя ученым более глубоко проанализировать происхождение и эволюцию вирусов в различных природных условиях, включая экстремальные среды, как горячие источники и соленые озера.

Бесконечное число вирусов

Вирусы, являясь вездесущими микроорганизмами, способны инфицировать широкий спектр организмов, включая животных, растения и даже бактерии. Несмотря на их повсеместное существование, лишь небольшая часть вирусов была идентифицирована и классифицирована учеными. По словам Артема Бабаяна из Университета Торонто, количество еще не открытых вирусов кажется практически бесконечным. Эти вирусы могут находиться в самых необычных средах и проявлять уникальные характеристики, что делает их изучение важным как с научной, так и с практической точки зрения. Более того, ряд из этих вирусов способны вызывать заболевания у людей, что подчеркивает необходимость их детального анализа. Исследование новых вирусов может помочь в понимании механизмов, стоящих за различными загадочными болезнями, и способствует созданию новых подходов к их диагностике и лечению.

Предыдущие исследования и особенности метода

В предыдущих исследованиях ученые применяли методы машинного обучения для поиска новых вирусов в обширных данных секвенирования, однако последнее исследование, опубликованное в журнале Cell, подняло эти усилия на новый уровень, сосредоточившись на прогнозировании белковых структур. Искусственный интеллект, используемый в этой работе, включает инструмент прогнозирования белков ESMFold, разработанный командой исследователей из Meta (ранее Facebook). Этот подход позволяет более точно идентифицировать вирусные белки, что является ключом к пониманию их функциональности и эволюции. Кроме того, стоит отметить, что аналогичная система, AlphaFold, разработанная в Google DeepMind, недавно была удостоена Нобелевской премии по химии за свои достижения в области прогнозирования структуры белков. Новый подход, основанный на интеграции данных о секвенировании и предсказаниях белковых структур, существенно расширяет возможность обнаружения неизвестных вирусов и углубляет знание о их эволюционной динамике.

Обнаружение новых вирусов

В 2022 году исследовательская группа под руководством Артема Бабаяна провела анализ 5,7 миллиона геномных образцов из открытых баз данных, что привело к открытию около 132 000 новых РНК-вирусов. Однако следует отметить, что из-за высокой скорости эволюции РНК-вирусов многие из существующих методов их обнаружения могут упускать значительное количество вирусов. Наиболее распространённым методом является поиск участков генома, которые кодируют ключевой белок, ответственный за репликацию РНК, известный как РНК-зависимая РНК-полимераза (RdRp). Тем не менее, если последовательность, кодирующая этот белок, значительно отличается от уже известных последовательностей, учёные могут просто не распознать её, что приводит к недоучету разнообразия вирусов. Это обстоятельство подчеркивает необходимость более продвинутых алгоритмов и методов, способных выявлять менее похожие, но потенциально опасные вирусы, что является актуальной задачей для будущих исследований.

Новая модель LucaProt

Ши Ман и его команда из Университета Сунь Ятсена в Шэньчжэне разработали уникальную модель LucaProt, основанную на трансформерной архитектуре, которая также лежит в основе таких известных систем, как ChatGPT. Эта модель была специально обучена для распознавания вирусных РНК-зависимых РНК-полимераз (RdRp), ключевых ферментов, свидетельствующих о наличии вирусов в геномных данных. В результате использования LucaProt они смогли идентифицировать около 160 000 ранее неизвестных РНК-вирусов. Между тем, среди полученных данных оказались вирусы, которые отличаются своим размером и были обнаружены в экстремальных условиях, таких как горячие источники, соленые озера и даже в воздухе. Удивительно, что почти половина из этих вирусов не имела описаний в научной литературе, что подчеркивает значимость нового подхода к исследованию вирусного разнообразия и потенциальные открытия в области вирусной экологии.

Расширение вирусного мира

Расширение пула известных вирусов открывает новые горизонты для исследования и понимания вирусного мира. Джеки Махар, эволюционист-вирусолог из Австралийского центра готовности к болезням при CSIRO, подчеркивает, что этот подход позволяет глубже разгадать тайны происхождения и эволюции вирусов в различных экосистемах и организмах. Благодаря новым методам, таким как использование искусственного интеллекта для нахождения ранее неизвестных вирусов, ученые получают возможность обнаруживать маленькие очаги вирусного разнообразия, которые до этого оставались незаметными.

Тем не менее, команда исследователей столкнулась с трудностью определения хозяев для вновь идентифицированных вирусов, что требует дополнительного изучения. Особенно интересно выяснить, могут ли новые RNA-вирусы заражать археи — уникальную группу организмов, для которых на сегодняшний день не известно о наличии RNA-вирусов. Такое исследование может значительно расширить наши представления о взаимодействии вирусов с различными формами жизни на Земле.

Прогнозирование хозяев

Ши Ман и его команда разрабатывают инновационную модель, которая позволит прогнозировать хозяев вновь идентифицированных РНК-вирусов. Эта работа имеет значительное значение для науки, так как понимание взаимодействий между вирусами и их хозяевами является ключевым аспектом для изучения экосистем и ролей микробов в них. Исследователи рассчитывают, что новая модель сможет выявить, какие организмы могут служить носителями этих вирусов, а также уточнить их экологические ниши. С помощью прогнозирования хозяев ученые смогут глубже понять, как вирусы эволюционируют, адаптируются и влияют на здоровье своих хозяев и экосистему в целом. Это станет важным шагом в расширении нашего понимания вирусного разнообразия и его значения для биосферы.

Поиск