Новые модели Phi революционизируют малые языковые модели ИИ

Microsoft представила новые модели Phi-4, включая Phi-4-reasoning, Phi-4-reasoning-plus и Phi-4-mini-reasoning, которые значительно расширяют возможности малых языковых моделей. Эти модели превосходят большие модели в математическом рассуждении и доступны на Azure AI Foundry
Новости 2025 05 01

Новая эра малых языковых моделей

Год назад Microsoft представила свои малые языковые модели (SLMs), выпустив Phi-3 на платформе Azure AI Foundry. Это событие стало важным этапом в разработке эффективных AI-моделей, предоставляя клиентам новые инструменты для решения различных задач. Сегодня компания с гордостью анонсирует новые модели: Phi-4-reasoning, Phi-4-reasoning-plus и Phi-4-mini-reasoning. Эти модели знаменуют собой новую эру для малых языковых моделей, и их возможности вновь переопределяют пределы компактных и эффективных AI. Phi-4-reasoning и его расширенная версия Phi-4-reasoning-plus демонстрируют высокую производительность на сложных задачах, подобных математическому рассуждению, что ранее считалось прерогативой только больших моделей. Phi-4-mini-reasoning, в свою очередь, оптимизирован для работы в условиях ограниченного вычислительного пространства, предоставляя мощные инструменты для образовательных приложений и мобильных устройств.

Модели рассуждения: следующий шаг вперед

Модели рассуждения представляют собой значительный шаг вперед в разработке малых языковых моделей искусственного интеллекта. Они специально обучены для выполнения сложных задач, которые требуют многошагового анализа и внутреннего размышления. Используя масштабирование во время инференса, эти модели могут эффективно справляться с задачами, которые ранее были доступны лишь более крупным моделям. Обучение с применением методов дистилляции и подкрепления, в сочетании с высококачественными данными, обеспечивает им оптимальное соотношение между размером и производительностью. Это делает их идеальными для использования в условиях, ограниченных по вычислительным ресурсам, что позволяет реализовывать сложные операции даже на небольших устройствах. Благодаря этому достигнуто новое качество в производительности малых языковых моделей, что открывает широкие возможности для их применения в различных областях.

Phi-4-reasoning и Phi-4-reasoning-plus

Phi-4-reasoning — это модель, обладающая 14 миллиардами параметров, которая открывает новые горизонты для малых языковых моделей, демонстрируя возможности, ранее доступные лишь более крупным аналогам. Она была обучена на тщательно подобранных демонстрациях рассуждений, что позволяет ей успешно соревноваться с крупными моделями благодаря высококачественной подготовке данных. Phi-4-reasoning-plus, в свою очередь, представляет собой улучшенную версию, оснащенную механизмами обучения с подкреплением и увеличенной количественной допуском токенов для повышения точности выводов. Несмотря на сравнительно небольшой размер, обе модели показывают выдающиеся результаты в тестах по математике и сложным вопросам уровня Ph.D., превосходя такие модели, как OpenAI o1-mini и DeepSeek-R1-Distill-Llama-70B. Эти достижения подтверждают, что малые модели могут эффективно выполнять сложные задачи и использоваться в самых разных приложениях, доступных на платформах Azure AI Foundry и HuggingFace.

Phi-4-mini-reasoning

Phi-4-mini-reasoning представляет собой высокоэффективную компактную модель, ориентированную на решения математических задач. Эта модель была разработана с учетом потребностей пользователей, которым необходима мощная функциональность в условиях ограниченных вычислительных ресурсов. Благодаря своему трансформерному архитектурному подходу, Phi-4-mini-reasoning обеспечивает качественное пошаговое решение задач, позволяя пользователям успешно справляться с математическими задачами, начиная с уровня средней школы и заканчивая уровнем научных исследований.

Модель наилучшим образом подходит для образовательных приложений, таких как интерактивные учебники и обучающие платформы, где важна доступность и скорость реагирования. Разработанная с использованием синтетических данных, сгенерированных более крупными моделями, она создает баланс между эффективностью и мощностью рассуждений. В условиях дефицита вычислительных ресурсов или при необходимости быстрого отклика Phi-4-mini-reasoning является идеальным выбором для легкого развертывания на мобильных устройствах или встраиваемых системах.

Развиваясь вместе с Windows 11

Модели Phi стали важным компонентом для компьютеров на базе Windows 11, особенно в версиях Copilot+, оптимизированных для работы с нейронными процессорами (NPU). Phi Silica обеспечивает быстрое реагирование на запросы и эффективно использует энергоресурсы, позволяя одновременно запускать другие приложения. Это делает модели Phi идеальными для поддержания высокой производительности даже в условиях ограниченных ресурсов. Например, благодаря интеграции с Outlook, пользователи могут получать оффлайн-функции резюмирования, что значительно облегчает работу с текстовой информацией. Интеллектуальные инструменты Phi, доступные для различных приложений, обеспечивают быстрое и качественное выполнение сложных задач, расширяя возможности пользователей и повышая их продуктивность.

Обновление моделей для Snapdragon

Модели Phi-4-reasoning и Phi-4-mini-reasoning теперь доступны на ПК с Copilot+ на базе Snapdragon, благодаря оптимизации с использованием технологии ONNX. Это обновление позволяет моделям более эффективно использовать вычислительные ресурсы во время инференса, значительно снижая потребление энергии.

Оптимизация для Neural Processing Unit (NPU) обеспечивает повышенную производительность и точность в выполнении сложных задач без значительных затрат на электроэнергию, что делает их идеальными для использования на устройствах с ограниченными ресурсами. Пользователи могут рассчитывать на улучшенное время отклика и возможность запуска моделей одновременно с другими приложениями. Это новшество будет способствовать более широкой интеграции AI-технологий в повседневные задачи, улучшая пользовательский опыт и расширяя возможности устройств, работающих на базе Snapdragon.

Ответственный подход к AI от Microsoft

В Microsoft мы уверенно подходим к разработке искусственного интеллекта, основываясь на принципах ответственности, включая безопасность, прозрачность и инклюзивность. Наша команда применяет различные методы, такие как Supervised Fine-Tuning (SFT), Direct Preference Optimization (DPO) и Reinforcement Learning from Human Feedback (RLHF), чтобы гарантировать, что модели Phi функционируют как эффективно, так и безопасно. Эти подходы позволяют нам развивать алгоритмы, которые не только достигают высоких результатов в выполнении задач, но и делают это безопасно и с учетом человеческих ценностей.

При создании моделей Phi мы учитываем множество факторов, включая доступность данных и их качество, чтобы минимизировать потенциальные риски. Однако важно помнить, что ни одна модель не лишена ограничений. Для более подробной информации о мерах безопасности и принципах ответственного использования технологий, пользователи могут обратиться к карточкам модели. Эти документы содержат ключевые сведения о практике и рекомендациях, которые помогают гарантировать, что наш AI будет служить наилучшим образом, уважая права и потребности всех пользователей.

Поиск