Проблемы с новой моделью синтеза изображений от Stability AI

Компания Stability AI столкнулась с критикой из-за новой модели синтеза изображений, порождающей ужасающие творения вместо фотореалистичных изображений. Внутренние проблемы, уход основателя и слухи о финансовых трудностях усугубляют ситуацию. Пользователи выразили разочарование в слабой проработке человеческой анатомии и технических сбоях
Новости 2024 07 03

Проблемы с новой моделью синтеза изображений от Stability AI

На этой неделе компания Stability AI представила свою новую модель синтеза изображений – Stable Diffusion 3 Medium (SD3M), называя ее "нашей самой сложной моделью генерации изображений на сегодняшний день." Однако, вместо желанного успеха, пользователи столкнулись с регулярным появлением захватывающих ужасом существ, созданных этой моделью. Сообщества Reddit и X быстро откликнулись на результаты, высказывая свое разочарование и сомнения в качестве новой модели, назвав ее даже шуткой. Недовольство растет, поскольку даже обычные описания, такие как "фотография человека, спящего в гостиной," приводят к созданию монструозных образов, не имеющих отношения к реальности. Критики также отмечают проблемы с анатомией людей в изображениях, что связывают с строгой фильтрацией взрослого контента из обучающих данных. Внутренние проблемы компании, такие как уход ключевых членов команды и слухи о финансовых трудностях, только усугубляют ситуацию.

Высокие ожидания и разочарование

Компания Stability AI с высокими надеждами представила общественности свою новую модель синтеза изображений — Stable Diffusion 3 Medium (SD3M), описывая ее как "нашу самую сложную модель генерации изображений на сегодняшний день". Однако реальные пользователи столкнулись с несоответствием ожиданий, обнаружив, что модель чаще производит ужасающих монстров, чем искусные произведения искусства.

Обещание компании о том, что модель "предоставляет изображения с исключительной детализацией, цветом и освещением, обеспечивая фотореалистичные результаты, а также высококачественные изображения в различных стилях", и улучшенная производительность в области "традиционных проблемных аспектов других моделей, таких как реализм в руках и лицах", кажутся оказавшимися зрительно запредельными в оценке фактических результатов пользователей. Хотя некоторые изображения, созданные SD3M, могут выглядеть приемлемо, большинство пользователей встретили больше разочарований, чем восторга.

Реакция сообщества

Реакция сообщества на последний релиз компании Stability AI была обескураживающей. В популярном сообществе Reddit пользователь под ником Coyotewld описал качество изображений, созданных новой моделью Stable Diffusion 3 Medium, как чрезвычайно низкое. Другие участники выразили свое разочарование, отмечая, что они не могут получить приличные результаты при использовании разнообразных запросов. Например, запрос на "фотографию человека, спящего в гостиной" приводит к созданию ужасающих образов, вызывая недоумение идущее даже за рамки стандартных проблемных областей в моделях искусственного интеллекта.

‘Photograph of a person napping in a living room
Фото: Источник
‘Photograph of a person napping in a living room,’ created by Reddit user quill18.
×

Проблемы с рендерингом рук и лиц

Рендеринг рук и лиц остается одной из основных проблем новой модели синтеза изображений Stable Diffusion 3 Medium от Stability AI. Пользователь с псевдонимом –Dave-AI– с иронией отмечает, что хотя рендеринг рук улучшился, общая картина с моделью остается негативной. В социальных сетях появляется множество провальных примеров изображений, подчеркивающих сложности, с которыми сталкиваются пользователи при использовании этой новой модели. Критика фокусируется на том, что несмотря на улучшения и перспективы, компания Stability AI по-прежнему сталкивается с вызовами и критикой со стороны публики, выявляя необходимость дальнейших улучшений и корректировок в работе модели для удовлетворения потребностей пользователей и укрепления своей позиции на рынке генеративного искусства.

Unknown prompt
Фото: Источник
Unknown prompt. Image created by Reddit user –Dave-AI–.
×

Unknown prompt
Фото: Источник
Unknown prompt. Image created by X user 'hoblin'.
×

Unknown prompt
Фото: Источник
‘Woman wearing a dress on the beach,’ created by Reddit user Perfect-Campaign9551.
×

Причины провала

Множество пользователей связывают провал новой модели синтеза изображений Stable Diffusion 3 Medium (SD3M) компании Stability AI с жёсткой цензурой, введённой в последнее время. Ужесточение фильтрации контента для взрослых (NSFW) привело к недостаточному обучению модели в части человеческой анатомии, что привело к некачественным изображениям, особенно в отношении изображений рук и ног. Эта ситуация усугублена оттоком ключевых сотрудников, включая основателя и генерального директора компании, Эмада Мостака, и нескольких ведущих инженеров. Эти события ставят Stability AI под дополнительное давление, усложняя процесс разработки и внедрения новых технологий.

Открытая природа и её последствия

Открытость Stable Diffusion к обществу означает, что пользователи могут вносить свой вклад в дальнейшее усовершенствование модели через общественную настройку. Однако такая открытость имеет свои негативные стороны. Недавние случаи злоупотребления моделями Stable Diffusion для создания недопустимого контента, включая незаконные и неэтичные материалы, привлекли к себе значительное внимание общественности. В результате этих споров генераторы изображений на основе искусственного интеллекта, включая SD3M, стали объектом широкого обсуждения и критики. Пользователи модели видят в этом одну из причин текущих проблем с качеством сгенерированных изображений, особенно в части обработки человеческой анатомии.

Свет в конце тоннеля

Несмотря на серьезные проблемы, с которыми столкнулась компания Stability AI с выпуском новой модели синтеза изображений, некоторые пользователи остаются оптимистичными относительно ее будущего. Им кажется, что сообщество сможет внести свой вклад, доработав модель и исправив ее недостатки. Возможно, как говорится, иногда для ИИ моделей необходимо пройти через начальные сложности, прежде чем они смогут достичь желаемого уровня качества. Таким образом, несмотря на трудности, с которыми столкнулась компания в начале 2024 года, благодаря поддержке сообщества и возможностям для улучшения, существует надежда на успешное развитие и совершенствование модели в будущем.

Поиск