OpenAI встраивает невидимые водяные знаки в генерируемый текст

OpenAI внедряет невидимые водяные знаки в текст
Недавно стало известно, что искусственный интеллект от OpenAI, в частности модели o4-mini и o3, оставляет в сгенерированном тексте невидимые водяные знаки. Эти метки представляют собой коды неразрывного пробела в формате Unicode, которые по умолчанию скрыты в популярных текстовых редакторах, таких как Microsoft Word и браузеры. Однако специализированные инструменты, такие как Sublime Text и VS Code, способны выявить эти скрытые символы. Интересно, что водяные знаки появляются в случайных местах, что затрудняет их обнаружение. Исследователи отмечают, что подобные метки могут дать разработчикам возможность идентифицировать текст, созданный ИИ, что особенно актуально в контексте учебных заведений и проверки студенческих работ. Считается, что такие меры могут помочь в борьбе с плагиатом, однако быстрое развитие технологий позволяет пользователям находить способы обходить эти знаки, например, через преобразование текста в аудиоформат или его ручное переписывание.
Как распознать водяные знаки
Обнаружение невидимых водяных знаков, встроенных в текст, становится все более актуальной задачей, особенно в контексте использования ИИ в учебных заведениях. Основная сложность заключается в том, что эти метки не отображаются в большинстве популярных текстовых редакторов, таких как Microsoft Word или браузеры. Однако пользователи могут воспользоваться специализированными инструментами для разработки, такими как Sublime Text и VS Code, чтобы выявить наличие скрытых символов, представляющих собой коды неразрывного пробела в формате Unicode.
Характерное размещение этих символов может служить индикатором того, что OpenAI возможно намеревается использовать данную технологию для проверки сгенерированного контента, например, в студенческих работах. Исследования показывают, что невидимые метки появляются в длинных текстах, что дополнительно подтверждает теории о намерениях компании. Испытывая систему на практике, студенты могут провести анализ на наличие водяных знаков, что создаёт новую динамику в борьбе за оригинальность и качество выполненных учебных заданий.
Что говорят прежние заявления OpenAI
Ранее OpenAI озвучила свои планы относительно внедрения водяных знаков в тексты, создаваемые ChatGPT, и заявила, что не будет использовать эту технологию. Несмотря на наличие инструментов для выявления скрытых меток, компания решила отложить запуск этой функции. Основной причиной такого шага стали опасения о возможном негативном влиянии на популярность ChatGPT и, соответственно, на прибыль компании. В то время как водяные знаки могли бы помочь избежать мошенничества и обеспечить уверенность в оригинальности контента, их введение могло бы отпугнуть пользователей, что, по мнению OpenAI, не оправдало бы предполагаемые преимущества. Такие соображения подчеркивают деликатное равновесие между инновациями и потребительскими интересами, с которым разработчики сталкиваются в условиях быстро меняющегося рынка искусственного интеллекта.
Способы обхода невидимых символов
Несмотря на наличие невидимых символов, встраиваемых в текст, существует несколько методов их обхода, позволяющих пользователям избежать последствий от таких водяных знаков. Один из наиболее распространенных способов — создание скриншота текста. Полученное изображение затем обрабатывается с помощью специализированных сервисов или программного обеспечения для распознавания текста, что позволяет экстрагировать информацию в привычном виде.
Еще одним методом является конвертация текста в аудиоформат. Ручное или автоматическое озвучивание текста с последующим преобразованием звукового файла обратно в текст может помочь избавиться от скрытых символов.
Кроме того, с юмором подразумевается самый простой и надежный вариант — перепечатать текст вручную, глядя на оригинальный ответ нейросети. Такой подход позволяет избежать любых манипуляций с кодами, ведь технология скрытного шифрования просто не сможет их обнаружить. Эти методы подчеркивают, что, несмотря на старания разработчиков, защитить текст от манипуляций оказывается достаточно сложно.
Технология и её будущее
Разработчики подчеркивают, что невидимые символы, используемые как водяные знаки, чаще всего возникают в длинных текстах, оставляя короткие ответы «чистыми» от таких меток. Это создает предпосылки для теории о том, что OpenAI проводит тестирование водяных знаков с целью их использования в образовательных учреждениях, например, для проверки студенческих работ. В рамках нового пилотного проекта была предложена бесплатная подписка для студентов, действующая до конца учебного года, что свидетельствует о заинтересованности компании в отслеживании генерируемого контента. Однако, несмотря на потенциальную эффективность этой технологии, разработчики уже отмечают скорость появления утилит, способных удалять эти скрытые символы. Это может свести на нет усилия OpenAI по внедрению водяных знаков, подрывая их применение в будущем. Поэтому возникают вопросы о долгосрочной жизнеспособности этого подхода.
Вывод
Использование невидимых водяных знаков, внедряемых в тексты, сгенерированные ИИ, представляет собой новый подход к выявлению и проверке подлинности контента. Эти водяные знаки, хоть и остаются незаметными в большинстве популярных редакторов, могут быть обнаружены с помощью специализированных инструментов. Это открывает новые горизонты для борьбы с академическими недобросовестностями, так как позволяет легко определить, является ли текст результатом работы искусственного интеллекта.
Тем не менее, успешность этой технологии ставится под сомнение из-за ее простоты обхода. Существуют различные методы, позволяющие удалить эти невидимые символы, что может снижать эффективность их применения в долгосрочной перспективе. Интересно, что разработчики подчеркивают важность этой технологии именно в контексте образовательных учреждений, где она может сыграть ключевую роль в честности академических работ. Однако возникает вопрос: смогут ли учебные заведения адаптироваться к таким изменениям, прежде чем студенты найдут способы легко обходить эти защитные меры?