Сбер открывает доступ к ИИ-моделям для развития сообщества

Сбер открывает доступ к своим ИИ-технологиям в формате open-source для русскоязычного сообщества. В числе доступных моделей - GigaChat Lite и GigaEmbeddings-instruct, а также обновления GigaAM. Запущена база научных публикаций с работами российских авторов
Новости 2024 12 09

Сбер открывает доступ к ИИ-моделям и платформам для развития русскоязычного ИИ-сообщества

Сбер инициировал инициативу по открытию доступа к своим искусственным интеллектуальным моделям, направленную на развитие русскоязычного ИИ-сообщества. Научная команда компании разместила в open-source различные модели, среди которых GigaChat Lite и GigaEmbeddings-instruct. GigaChat Lite, обладающая архитектурой MoE и высокой скоростью обработки, подходит для решения типовых задач, а GigaEmbeddings-instruct эффективно преобразует текст в векторные представления, применимые в технологиях RAG. Технический директор GigaChat Федор Минькин также анонсировал обновления в моделях GigaAM, которые достигли значительного снижения ошибок при распознавании речи и эмоций. Кроме того, Сбер запускает базу научных публикаций в области ИИ, что позволит исследователям и организациям анализировать активность в данной сфере за последние десять лет.

Open-source модели от Сбера

Научная команда Сбера активно способствует развитию сообщества искусственного интеллекта, предоставляя доступ к своим моделям в формате open-source. Одним из главных достижений является GigaChat Lite, представленная в базовой и инструктивной версиях. Эта модель, построенная на архитектуре Lite 20B MoE и содержащая 3.3B активных параметров, демонстрирует высокую эффективность и скорость в выполнении типовых задач, что делает её конкурентоспособной с более мощными аналогами.

Важным дополнением к линейке моделей является GigaEmbeddings-instruct, уникальная модель, преобразующая текст в числовое представление, или вектор, что существенно расширяет возможности её применения в задачах, основанных на технологии Retrieval Augmented Generation (RAG). Согласно результатам бенчмарка ruMTEB, GigaEmbeddings-instruct занимает лидирующие позиции среди аналогичных моделей, что подтверждает её эффективность и качество работы в области обработки естественного языка.

Модели для распознавания речи и эмоций

На международной конференции AI Journey-2024 было анонсировано значительное обновление семейства моделей GigaAM, разработанных для распознавания речи и эмоций. Одной из ключевых улучшений стало снижение количества ошибок в словах на 25% для модели GigaAM-RNNT, что делает её конкурентоспособной на рынке технологий распознавания речи. Кроме того, новая версия моделей демонстрирует впечатляющие результаты, превосходя OpenAI-Whisper-large-v3 на 56%. Эти достижения стали возможными благодаря усовершенствованию методов подготовки данных и предобучения, что позволило повысить качество распознавания русскоязычных запросов.

Также переход на новое позиционное кодирование и внедрение технологии Flash Attention значительно ускорили процесс обучения и инференса, что особенно актуально на современных видеокартах. Модели теперь публикуются под лицензией MIT, что открывает возможности для их коммерческого использования, способствуя таким образом развитию ИИ-технологий в России и за её пределами.

Открытая база научных публикаций

Альянс в сфере искусственного интеллекта анонсировал запуск открытой платформы, на которой будет собираться информация о научных статьях российских авторов, представленных на ведущих мировых конференциях и в индексируемых журналах. В настоящее время база данных включает более 5,5 тыс. публикаций с российскими аффилиациями, начиная с 2014 года. Важным аспектом является эталонный датасет, содержащий 1000 верифицированных публикаций от таких ведущих образовательных учреждений, как Высшая школа экономики, ИТМО и МФТИ, за период 2019-2024 годов. Платформа предоставляет возможность авторам и исследователям регистрироваться и добавлять свои работы, в то время как пользователи могут без регистрации осуществлять поиск по авторам, организациям, конференциям и журналам. Этот ресурс предлагает аналитику публикационной активности, что может значительно способствовать развитию науки в России, позволяя систематизировать и анализировать данные о научных достижениях в области искусственного интеллекта.

Речь экспертов

Старший вице-президент Сбербанка Андрей Белевцев акцентировал, что искусственный интеллект является одной из самых научно емких технологий нашего времени. Он подчеркивает, что успешное развитие и прогресс в этой области, как правило, происходят благодаря исследованиям учёных. База публикаций, созданная Альянсом в рамках конференции AI Journey, станет важным инструментом для анализа динамики научной активности в России. Это позволит не только проследить за развитием отдельных направлений и организаций, но и дать возможность оценить вклад конкретных авторов в научное сообщество за последние десять лет.

Александр Крайнов, директор по развитию технологий ИИ в Яндекса, выразил надежду на активное участие университетов и научных лабораторий в создании этой базы. Он отметил, что без их поддержки нельзя будет собрать и структурировать полную картину о российской научной деятельности в области ИИ. Таким образом, вовлечение научного сообщества в проект является ключевым для обеспечения открытости и полноты базы, что в конечном итоге поможет повысить уровень отечественной науки в данной области.

Функционал и доступ

Зарегистрированные пользователи смогут воспользоваться бесплатным доступом к обширной базе данных научных публикаций в области искусственного интеллекта через API, что значительно упростит процесс получения информации. База, создаваемая университетом ИТМО, включает специальные аналитические инструменты, которые позволят исследователям анализировать публикационную активность по множеству параметров. Это означает, что пользователи смогут не только отслеживать количество и качество публикаций, но и выявлять тренды, направления и динамику научных исследований. При помощи этих инструментов можно будет глубже понимать достижения отечественных ученых и их вклад в развитие науки, что, в свою очередь, способствует более целенаправленному прогрессу в области искусственного интеллекта. Эффективное использование данной базы позволит российским исследователям лучше координировать усилия и обмениваться знаниями, что, безусловно, окажет положительное влияние на весь научный ландшафт.

Поиск