Китай стремительно догоняет США в области LLM

На пути к лидерству
Всего лишь год назад Китай находился на заднем плане в гонке по разработке языковых моделей. На конец 2023 года его самая продвинутая модель, Alibaba Qwen Chat 7B, оставалась далека от американской GPT-3.5 Turbo. Эта разрыв в технологиях подтолкнул китайские компании к поиску оптимальных решений и к активному вложению ресурсов в исследования и разработки в области LLM.
С началом 2024 года Китай начал осваивать более мощные модели, таких как Alibaba Qwen Chat 72B, которая уже смогла продемонстрировать результаты, близкие к GPT-3.5, но все еще оставалась позади более совершенной GPT-4. Лето 2024 стало поворотным моментом: с появлением DeepSeek V2 китайские модели начали набирать популярность, хотя и не достигли уровня соперничества с GPT-4o. Однако это было лишь началом. Сравнительно быстрое развитие технологий LLM в Китае стало очевидно, когда Alibaba Qwen 2.5 Instruct 72B показала результаты, сопоставимые с ведущими американскими моделями. Этот ускоренный прогресс может значительно изменить расклад сил в мировой индустрии LLM в ближайшие годы.
Ситуация в начале 2024 года
В начале 2024 года Китай значительно улучшил свои разработки в области языковых моделей, представив модель Alibaba Qwen Chat 72B. Эта модель смогла превзойти GPT-3.5, однако по сравнению с более продвинутой GPT-4 она всё ещё значительно уступала, особенно в мультимодальных задачах, что подчеркивало разницу в качестве и функциональности между китайскими и американскими LLM. Летом 2024 года на арене появилась модель DeepSeek V2, которая, несмотря на свои достижения, также не смогла добиться существенных результатов по сравнению с GPT-4o. Конкуренция усилилась с выходом Alibaba Qwen 2 Instruct 72B, которая немного опередила DeepSeek V2. Однако, даже эта модель не представляла серьёзной угрозы для лидирующей позиции GPT-4o, демонстрируя, что хотя Китай и активно развивает свои технологии, ещё необходимо время для достижения полной конкурентоспособности с американскими разработками.
Усиление китайских позиций
Осенью 2024 года на рынок вышла Alibaba Qwen 2.5 Instruct 72B, что стало тревожным сигналом для США: эта модель достигла уровня паритета с GPT-4o и даже превзошла её в ряде задач. Это событие обозначило переломный момент в гонке за лидерство среди языковых моделей, поскольку теперь китайские разработки начали угрожать доминированию американских технологий. В этот же период OpenAI представила OpenAI o1-preview, который открыл новую эру в производительности, но необходимо отметить, что с момента релиза GPT-4 в марте 2023 года существенных изменений в фундаментальной архитектуре LLM от OpenAI не произошло. Улучшения касались в основном расширения контекстного окна и повышения мультимодальности — без значительных стратегических нового подхода. Это дало возможность китайским разработчикам, таких как Alibaba, выравнять позиции и даже продвинуться вперёд, открыв новые горизонты для конкуренции в области искусственного интеллекта.
Ситуация в декабре 2024
В декабре 2024 года на арене искусственного интеллекта разгорелась настоящая битва за лидерство между китайскими и американскими разработчиками LLM. Именно в этом месяце DeepSeek представила свою модель V3, которая смогла продемонстрировать значительное преимущество перед предыдущими версиями и достижениям китайских LLM, превосходя, в первую очередь, GPT-4o. Тем не менее, несмотря на свои впечатляющие характеристики, эта модель оказалась позади расширенной версии LLM от OpenAI, которая была внедрена в тот же период.
Таким образом, в это время китайская модель V3 стала символом прогресса в рамках нарастающей конкуренции, подтверждая, что китайские разработчики способны создавать высокопроизводительные технологии. Однако стремление DeepSeek достичь и перегнать OpenAI пока не увенчалось успехом, что говорит о том, что несмотря на значительный прогресс, китайская индустрия в данной области все еще сталкивается с трудностями, требующими решения для дальнейшего продвижения вперед. Это противостояние подчеркивает важность инноваций и скорости их внедрения в быстро меняющемся мире технологий.
Январь 2025 и далее
В середине января 2025 года китайская компания DeepSeek сделала значительный шаг вперед, представив свою новую модель R1. Эта LLM не только превосходила все предыдущие версии, но и показала, что китайские разработки способны вплотную приблизиться к конкурентам из США. Выход R1 стал знаковым моментом в гонке за лидерство в области искусственного интеллекта, так как на протяжении долгого времени китайские модели значительно отставали от аналогов OpenAI.
Однако дистанция между китайскими и американскими инновациями вновь сократилась ненадолго. В ответ на успешный релиз DeepSeek, OpenAI быстро внедрила свою новую модель o3, что позволило ей восстановить лидирующие позиции. Несмотря на это, отрыв не оказался столь впечатляющим, как в предыдущие периоды. Это указывает на изменение динамики войны за первенство в LLM — китайские компании начинают набирать скорость, а американские разработчики вынуждены держать руку на пульсе, чтобы поддерживать конкурентоспособность. Битва за лидерство в области искусственного интеллекта вступила в новую, более острую фазу, где каждое нововведение может коренным образом изменить расстановку сил.
Эмбарго на чипы Nvidia
Для понимания обоснованности жёсткого экспортного эмбарго на чипы Nvidia в Китай важно осознать, как развивались китайские LLM в последние годы. С осени 2023 года на китайские компании были наложены ограничения на доступ к передовым модификациям чипов от Nvidia. В результате, несмотря на сильное отставание, Китай смог достичь значительных успехов в области LLM, хотя и с ограниченными вычислительными мощностями. Стремительное развитие китайских технологий и их способность соперничать с американскими аналогами, такими как GPT-4o, заставляют задуматься о последствиях этого эмбарго.
В условиях нехватки ресурсов китайские компании, такие как Alibaba и DeepSeek, проявили удивительную скорость в разработке современных моделей. Тем не менее, экспортные ограничения, введенные ранее, могут затруднить дальнейшее продвижение и инновации. Это создает уникальное сочетание факторов, при котором Китай, несмотря на начальное отставание и ограничения, находится на пути к лидерству в области LLM, что и делает эмбарго стратегически важным для США.
Прогнозы и текущая ситуация
Несмотря на запоздалый старт в гонке за лидерство в сфере LLM, Китай демонстрирует впечатляющий прогресс. Уже к концу 2025 года китайские модели, такие как DeepSeek и Qwen, могут занять ведущие позиции на рынке, особенно в свете замедления инновационного процесса у других крупных игроков, как Google с ее Gemini 2.0 Pro. Количество разработок в Китае продолжает расти, и среди новых моделей стоит отметить Moonshot - Kimi 1.5 и StepFun – Step R-mini, которые уже начинают соперничать с такими гигантами, как GPT-4o. Интересно, что активное внимание Bloomberg к успехам DeepSeek лишь подчеркивает, что это далеко не единственная выдающаяся разработка в Китае. Текущая динамика и темпы усовершенствования китайских LLM могут создать серьезные вызовы для американских компаний, и будущее обещает множество неожиданных поворотов в этой конкурентной битве.
Китай демонстрирует впечатляющие темпы в развитии моделей большого языка (LLM), несмотря на ограниченные вычислительные мощности. Это свидетельствует о высоком уровне инноваций и адаптации, которые внедряются китайскими компаниями. Сравнение с США, где ресурсная база значительно выше, указывает на необходимость внимательного анализа возможных путей развития китайского ИИ. Если такой стремительный прогресс сохранится, в будущем китайские модели могут значительно опередить их американских конкурентов не только в производительности, но и в универсальности применения.
Учитывая текущие достижения и множество продвинутых моделей, разрабатываемых в Китае, можно ожидать, что к 2025 году Китай может занять лидирующие позиции на мировом рынке LLM. Конкуренция будет накаляться, что приведет к ещё более активной разработке и внедрению новых технологий. Данное развитие создаёт дополнительные вызовы для США и других стран, которые могут остаться позади. Такой сценарий может коренным образом изменить текущий ландшафт ИИ, предоставляя китайским разработчикам уникальные возможности для доминирования в этой высокотехнологичной сфере.