Google создает ИИ для имитации физического мира

Google формирует новую команду для разработки ИИ, имитирующего физический мир, под руководством Тима Брукса. Основное внимание уделено созданию масштабируемых моделей через сотрудничество с проектами Gemini, Veo и Genie. Ожидается активное влияние на креативные индустрии и необходимость решения вопросов авторского права

Новости 2025 01 10

Google создает ИИ для имитации физического мира

Google формирует новую команду для разработки ИИ, способного имитировать физический мир. Эта инициатива возглавит Тим Брукс, который ранее работал в OpenAI над проектом генератора видео Sora и присоединился к лаборатории Google DeepMind в октябре. Брукс объявил о наборе специалистов для команды, цель которой — создание масштабируемых генеративных моделей, способных симулировать различные аспекты реального мира.

В своей работе команда будет опираться на достижения других групп Google, таких как Gemini, Veo и Genie. Gemini отвечает за анализ изображений и генерацию текста, Veo является моделью для создания видео, а Genie разработан для симуляции игр и 3D-сред в реальном времени. Брукс подчеркивает, что эффективная работа с видео и мультимодальными данными является критически важной для достижения искусственного общего интеллекта (AGI), который сможет решать задачи на уровне человека.

Амбициозные планы DeepMind

DeepMind ставит перед собой грандиозные задачи по разработке мощных генеративных моделей, способных имитировать физический мир. Тим Брукс, один из руководителей команды, сообщил, что новая группа будет работать в сотрудничестве с уже существующими проектами Google, такими как Gemini, Veo и Genie. Цель этой команды — решать ключевые задачи и масштабировать разработанные модели до самых высоких уровней вычислений. Gemini представляет собой серию флагманских моделей AI от Google, которые выполняют задачи анализа изображений и генерации текста, в то время как Veo отвечает за создание видео. Брукс акцентирует внимание на том, что интеграция с этими командами позволит разрабатывать более сложные и эффектные миры, что в свою очередь приближает исследование к достижению искусственного общего интеллекта (AGI).

Разработка мировых моделей

Genie — это инновационный подход Google к созданию мировых моделей, который позволяет искусственному интеллекту симулировать игры и трехмерные среды в реальном времени. Эта модель, представленная в декабре прошлого года, обладает способностью генерировать огромное разнообразие игровых 3D-миров, что открывает новые горизонты для интерактивного развлечения и проектирования виртуальных пространств. Команда Тим Брукса в Google DeepMind будет сосредоточена на разработке инструментов для «интерактивной генерации в реальном времени», что позволит пользователям взаимодействовать с созданными моделями непосредственно во время их работы. Кроме того, важным аспектом работы команды станет изучение методов интеграции новых моделей с уже существующими мультимодальными системами, такими как Gemini, что может привести к созданию более сложных и многофункциональных AI-решений в области симуляции и развлечений.

Конкуренты и критика

Мировые модели, разрабатываемые такими стартапами, как World Labs, Decart и Odyssey, обещают революционизировать создание интерактивных медиа и реалистичных симуляций. Однако среди творческих профессионалов существует настороженность относительно распространения технологий ИИ. Например, недавнее расследование показало, что игровые студии, такие как Activision Blizzard, использующие ИИ для повышения продуктивности, также уволили множество сотрудников, что вызывает опасения в индустрии. Исследование Гильдии аниматоров предрекает, что более 100,000 рабочих мест в кино и анимации могут быть под угрозой к 2026 году. Некоторые стартапы, такие как Odyssey, выступают за сотрудничество с креативным сообществом, а не противостояние ему. Ожидается, что Google тоже примет в расчет этот важный аспект, чтобы обеспечить гармоничное сосуществование технологий ИИ и творческих профессий.

Вопрос авторских прав

Существует значительная неопределенность в вопросах авторских прав относительно новых мировых моделей, разрабатываемых Google и другими компаниями. Некоторые из этих моделей обучаются на видеозаписях игрового процесса, что потенциально делает разработчиков целями судебных исков, если использование контента осуществляется без соответствующих лицензий. Google, владеющий платформой YouTube, утверждает, что у него есть разрешение на использование видео в рамках своих моделей на основании условий использования сайта. Тем не менее, компания не раскрывает конкретные источники видео, используемые в процессе обучения, что вызывает дополнительные вопросы о соблюдении авторских прав. Это создает риск для компаний, которые могут столкнуться с правовыми последствиями, если их модели окажутся зависимыми от контента, на который у них нет необходимых прав.