Сторонние исследования по-прежнему подтверждают, что AI Content Detector является наиболее точным. |
Тематическое исследование
Copyleaks API
Обнаружение плагиата
Точность, глубина анализа и эффективность рабочего процесса
Национальное космическое общество (NSS) проводит ежегодный конкурс Джерарда К. О'Нила по космическим поселениям с 1994 года. Студентам не предъявляются какие-либо требования, кроме того, что проект должен быть сосредоточен на свободно плавающей концепции постоянного космического поселения. Каждый год тысячи учащихся со всего мира, начиная с 12-го класса, принимают участие в конкурсе, при этом большинство заявок подаются в форме эссе, а некоторые в прошлые годы достигали 200 страниц. В рамках процесса оценки каждое представление проверяется на предмет плагиата, и этот процесс выполняется вручную, что часто занимает от недель до месяцев.
NSS начала искать решение для ускорения процесса оценки и повышения эффективности, особенно в части обнаружения плагиата. Ключевым соображением при поиске решения была платформа с интеграцией API, которая могла бы беспрепятственно работать с Award Force, программным обеспечением для управления наградами, используемым для конкурса. Еще одной проблемой была эффективная и тщательная отчетность, документация и возможность обработки больших объемов контента и данных.
В 2018 году NSS начала работать с платформой Copyleaks, используя интеграцию API для обнаружения потенциального плагиата в конкурсных материалах. При каждом сканировании через Awards Force генерируется оценка подозрительности, позволяющая судьям принимать более быстрые и обоснованные решения о возможном плагиате. В результате время обработки сократилось с недель или месяцев до нескольких дней.
Мэтью Дж. Левин, директор конкурса космических поселений NSS Джерарда К. О'Нила.
NSS начала считать, что если оценка подозреваемых была 0%, это был автоматический пропуск; если это было 5% или больше, это обычно был автоматический сбой. Что-либо между 0-5% требовало дальнейшего изучения путем более глубокого анализа с использованием отчета о сходстве Copyleaks, генерируемого при каждом сканировании. В каждом отчете есть показатель схожести (рассчитывается иначе, чем вышеупомянутый показатель подозрительности), который дает более глубокую разбивку похожего текста, найденного в отсканированном документе. Эти разбивки отчетов позволяют судьям сравнивать тексты и определять, был ли контент плагиатом.
NSS также использует репозиторий Copyleaks, который позволяет им хранить все отсканированные материалы в защищенной частной базе данных, которую можно использовать для будущих сканирований для сравнения с ней, чтобы убедиться, что ни один участник не занимался плагиатом в прошлом.
Начиная с Copyleaks, NSS смогла обнаруживать плагиат гораздо быстрее и точнее в конкурсных материалах. Например, в 2023 году из 4567 заявок 1894 были дисквалифицированы за плагиат, что значительно больше, чем когда задача выполнялась вручную.
NSS также рассматривает вопрос о том, как контент, созданный ИИ из чат-ботов, таких как ChatGPT, повлияет на конкурс Gerard K. O'Neill Space Settlement Contest и его заявки, и изучает возможность использования детектора контента AI Copyleaks в качестве недавно реализованной части процесса судейства.