Запуск моделей o3 и o4-mini для улучшенной продуктивности и безопасности
Введение моделей OpenAI o3 и o4-mini
Сегодня мы рады представить модели OpenAI o3 и o4-mini, последние достижения в серии моделей o, которые ориентированы на углубленный анализ информации перед тем, как предоставить ответы. Эти новейшие модели являются наиболее интеллектуальными среди всех, когда-либо выпущенных OpenAI, и демонстрируют значительное улучшение возможностей ChatGPT для пользователей с различными уровнями подготовки — от обычных пользователей до опытных ученых и исследователей. Модели o3 и o4-mini могут эффективно сочетать и применять все доступные инструменты ChatGPT, включая возможность поиска информации в интернете, анализ загруженных файлов с использованием языка программирования Python, а также глубокое осмысление визуальных данных. Это открывает новые горизонты для решения сложных задач, позволяя моделям проводить более многогранный и всесторонний анализ вопросов, что значительно повышает качество и точность предоставляемых ответов.
Что изменилось
OpenAI o3 представляет собой самую мощную модель рассуждения, которая значительно расширяет возможности в таких областях, как программирование, математика, наука и визуальное восприятие. Она устанавливает новый стандарт на различных тестах и проверках, включая Codeforces, SWE-bench и MMMU, демонстрируя превосходные результаты при выполнении сложных задач. Способность o3 осуществлять глубокий анализ визуальных данных, таких как изображения, графики и диаграммы, позволяет ей с успехом справляться с многосторонними вопросами. Внешние эксперты отметили, что o3 делает на 20% меньше серьезных ошибок по сравнению с предыдущей моделью OpenAI o1, что особенно важно для профессионалов в областях программирования и бизнеса, где точность и креативность имеют первостепенное значение.
В свою очередь, OpenAI o4-mini — это компактная, оптимизированная модель, которая обеспечивает быстрое и экономичное рассуждение. Несмотря на свои меньшие размеры, o4-mini демонстрирует впечатляющие результаты в математике, программировании и визуальных задачах. Например, в экзамене AIME 2025 модель достигла 99.5% успешного прохождения с первого раза и 100% консенсуса на восьмом. Это подчеркивает ее высокую эффективность и способность работать в условиях ограниченных ресурсов, предлагая пользователям надежные и качественные ответы на разнообразные запросы.
Продолжаем масштабировать обучение с подкреплением
В ходе разработки модели OpenAI o3 было отмечено, что применение крупномасштабного обучения с подкреплением демонстрирует тенденцию, согласно которой увеличение вычислительных ресурсов приводит к улучшению производительности моделей. Этот феномен аналогичен наблюдаемой в процессе предобучения моделей серии GPT, где прирост вычислительных мощностей также способствовал повышению качества результатов. Мы увеличили вычислительные мощности на порядок, что позволило добиться заметного роста производительности в различных задачах. Это подтверждает вывод, что модели становятся более эффективными и продуктивными, когда им даётся возможность "думать" дольше, обрабатывая больше информации перед формированием ответа. Инвестиции в вычислительную мощность приводят к четким улучшениям в работе моделей, что открывает новые горизонты для их применения в самых различных областях.
К использованию инструментов
Модели o3 и o4-mini оснащены полным доступом к инструментам внутри ChatGPT, что существенно расширяет их возможности. Они обучены не только решать задачи, но и анализировать, когда и каким образом применять различные инструменты для создания содержательных и качественных ответов. Это позволяет моделям более эффективно справляться с комплексными вопросами, требующими глубокого анализа и многослойного подхода. Например, если пользователь задает вопрос о потреблении энергии, модель может использовать интернет для поиска данных, написать код на Python для создания прогнозов, а затем визуализировать полученные результаты в виде графиков или изображений. Такой стратегический подход к использованию инструментов делает взаимодействие более продуктивным и информативным, позволяя моделям адаптироваться к новым данным и предоставлять актуальную информацию в реальном времени.
Безопасность
Каждое новое достижение в области моделирования напрямую связано с необходимостью повышения уровня безопасности. В связи с этим для моделей OpenAI o3 и o4-mini были кардинально обновлены данные, используемые для обучения в области безопасности. В этот процесс были включены новые отказные подсказки, направленные на предотвращение потенциальных угроз, таких как биологические риски, создание вредоносного ПО и обход системных ограничений.
Эти меры призваны не только значительно снизить риск неправомерного использования технологий, но и обеспечить более надежное взаимодействие пользователей с моделью. Специальные обучающие данные помогают моделям эффективно идентифицировать и отклонять рискованные запросы, тем самым повышая общую безопасность работы с этими инструментами. Это обеспечивает пользователям уверенность в том, что современные модели могут не только выполнять задачи, но и надежно защищать от возможных угроз.
Codex CLI: новое слово в анализе из командной строки
Codex CLI представляет собой инновационное решение, позволяющее пользователям работать с моделями OpenAI прямо из командной строки. Этот облегченный агент кодирования optimизирует возможности мультимодального анализа, предлагая простоту и удобство в использовании. Пользователи могут загружать свои рабочие процессы, передавая модели такие данные, как скриншоты или наброски, что делает взаимодействие более интуитивным и эффективным. Подключение к локальным файлам и коду открывает новые горизонты для разработчиков и исследователей, позволяя им использовать мощь моделей, не покидая привычной среды разработки. Codex CLI полностью открыт для сообщества и доступен на GitHub, что подчеркивает стремление OpenAI к сотрудничеству и поддержке новых идей.
Доступ
Пользователи ChatGPT Plus, Pro и Team уже сегодня могут воспользоваться новыми моделями o3, o4-mini и o4-mini-high, которые доступны в селекторе моделей. Эти обновленные модели заменяют предыдущие версии o1, o3-mini и o3-mini-high, обеспечивая более высокую производительность и улучшенные возможности обработки запросов. Пользователи ChatGPT Enterprise и Edu смогут получить доступ к этим моделям через неделю, что позволит им воспользоваться всеми преимуществами новых разработок. При этом ограничений по тарифам на использование этих моделей не предусмотрено, что позволяет всем пользователям продолжать работать в привычном режиме. Ожидается, что новые версии моделей значительно повысят качество взаимодействия с ChatGPT благодаря своей улучшенной способности к обработке сложных запросов и более естественному стилю общения.
Что дальше
С сегодняшними обновлениями мы продолжаем развивать наши модели в направлении интеграции специализированных возможностей рассуждения из серии o с более естественными и разговорными навыками, присущими серии GPT. Это объединение позволяет пользователям вести бесшовные и естественные диалоги с моделями, что делает взаимодействие более интуитивным и приятным.
Проактивное использование инструментов, встроенное в архитектуру моделей, направлено на решение сложных задач, требующих нескольких этапов рассуждения и обработки данных. Модели теперь способны не только генерировать ответы, но и эффективно взаимодействовать с различными инструментами, чтобы собирать актуальную информацию, анализировать ее и предоставлять детализированные ответы. Этот подход значительно расширяет спектр возможностей, доступных пользователям, и открывает новые горизонты для автоматизации самых разнообразных задач.