С развитием нейросетей, способных генерировать тексты, естественно возникла потребность в инструментах для их распознавания. Это можно сравнить с тем, как общество реагирует на появление любого нового изобретения, когда требуется установить систему контроля и проверки новых технологий.
На сегодняшний день существует множество сервисов, которые тщательно исследуют тексты, определяя вероятность их создания с помощью искусственного интеллекта. Эти инструменты отличаются своими алгоритмами и подходами, что позволяет рассматривать вопрос выявления сгенерированных текстов с разных сторон.
Каждый из этих сервисов применяет свои уникальные критерии оценки, благодаря чему их работа становится разнообразной и интересной. Для максимально точного анализа рекомендуется проверить текст сразу на нескольких платформах. Такой подход помогает получить более объективную картину и достичь высокой надежности результатов, предоставляя возможность многогранного анализа.
Содержание
Существуют пять основных признаков, которые помогут определить, что автором текста является искусственный интеллект:
1. Сухость и шаблонность формулировок
Нейросеть не обладает эмоциональностью и не способна передавать чувства так же естественно и убедительно, как человек. В её текстах часто можно встретить клише, избитые выражения и однотипные конструкции. Это связано с тем, что искусственный интеллект обучается на огромных массивах данных и склонен выбирать наиболее вероятные сочетания слов. Из-за этого в текстах нередко повторяются стандартные, предсказуемые фразы.
Кроме того, предложения, созданные нейросетью, обычно имеют одинаковую структуру и отличаются излишней формальностью. Часто используются отглагольные существительные, такие как «улучшение», «развитие», «обеспечение» и т.д.
2. Бессвязность абзацев и нелогичная структура
Тексты, сгенерированные искусственным интеллектом, нередко представляют собой набор разрозненных фактов, которые можно поменять местами без потери смысла. Особенно это заметно в длинных коммерческих статьях. Между абзацами отсутствует чёткая логическая связь, и текст не имеет плавного перехода от одной части к другой.
Кроме того, нейросети часто пренебрегают использованием связующих элементов. Максимум, что можно встретить, — это простые вводные конструкции вроде «во-первых» или «во-вторых».
3. Противоречия внутри текста
Из-за отсутствия логической взаимосвязи между частями текста в нём могут возникать несоответствия. Это особенно заметно в длинных статьях. Например, если нейросеть пишет материал о выборе подрядчика для бизнеса, сначала она может утверждать, что лучше всего выбирать компанию с широким спектром услуг, а затем, в другом абзаце, предложить отдать предпочтение узкопрофильному специалисту, мотивируя это тем, что такой подрядчик более компетентен в своей области.
4. Необычные или некорректные метафоры
Искусственный интеллект нередко использует слишком прямолинейные или неудачные сравнения. Он может соединить несопоставимые вещи, что приводит к странным или нелепым метафорам. Например, нейросеть способна написать, что "звонкий голос девушки" напоминает "звук работы микроволновки", или сравнить её танец с движениями «медузы, выброшенной на берег».
5. Обилие воды и чрезмерная абстрактность
Нейросети стараются угодить широкой аудитории, избегая конкретики и фактов. В результате в текстах появляется много длинных, бессодержательных фраз, которые практически не несут информации. Например: «Для достижения высоких показателей важно учитывать все аспекты, способствующие улучшению ваших результатов в различных сферах деятельности».
Подобные тексты кажутся объёмными, но на деле часто оказываются пустыми и не содержат никакой реальной пользы для читателя.
Функция распознавания текстов, созданных искусственным интеллектом, доступна лишь в платной версии сервиса. Разработчики компании Антиплагиат утверждают, что их инструмент был обучен и тщательно протестирован на широкой базе данных, что позволяет минимизировать вероятность ложных срабатываний.
В компании подчеркивают, что алгоритм детектора стал результатом долгих исследований в области обработки естественного языка. Исполнительный директор Юрий Чехович отметил, что, несмотря на успехи таких систем, как ChatGPT и Jasper, их тексты всё же отличаются от написанных людьми. Это связано с разницей в стиле изложения и структуре текста, которые современные ИИ-модели пока не могут полностью воспроизвести.
Система анализирует текст на наличие фрагментов, созданных языковыми моделями, такими как GPT-2, GPT-3, а также новейшими версиями ChatGPT. Найденные подозрительные участки выделяются красным цветом, а сам документ получает отметку, сигнализирующую о возможной неоригинальности, чтобы привлечь внимание проверяющего к этим частям.
Ранее, до внедрения обновленных функций в системе Антиплагиат, уже существовали сервисы с похожим подходом. Они работали на основе анализа предсказуемости слов в тексте. Такие инструменты определяют, насколько ожидаемым является следующее слово в построенной фразе. Например, если ввести «Каждый день он ходит на…», алгоритм предскажет наиболее вероятные слова вроде «работу» или «учебу». Хотя тексты, написанные человеком, также могут быть предсказуемыми, их структура обычно менее шаблонна, чем у ранних нейросетей. Современные ИИ-модели, например GPT-4, умеют генерировать тексты с большей степенью вариативности, что значительно усложняет их обнаружение.
Проверить текст на использование нейросети можно с помощью нашего сайта Anfox.ru. Для этого вам потребуется выполнить всего 5 простых шагов:
1. Загрузка документа
2. Укажите адрес электронной почты, куда мы сможем выслать отчет в формате pdf.
3. Выбор метода проверки
4. Оплатите проверку файла. Цена будет зависеть от количества страниц и выбранного вида обработки.
5. Скачайте файл после обработки. Обычно она занимает до 30 минут.