Тематическое исследование
API-интерфейс копилейков
Обнаружение плагиата
Точность, глубина анализа и эффективность рабочего процесса
Национальное космическое общество (NSS) с 1994 года проводит ежегодный конкурс космических поселений Джерарда К. О'Нила. Студентам не предъявляется никаких требований, кроме того, что проект должен сосредоточиться на концепции свободно плавающего, постоянного космического поселения. Ежегодно в конкурсе принимают участие тысячи учащихся со всего мира, начиная с 12-го класса, при этом большинство работ представлено в форме эссе, а в прошлые годы некоторые из них достигали 200 страниц. В рамках процесса судейства каждое представленное произведение проверяется на предмет плагиата. Этот процесс выполнялся вручную и часто занимал недели или месяцы.
NSS начала искать решение, которое могло бы ускорить процесс оценки и повысить эффективность, особенно в части обнаружения плагиата. Ключевым моментом при поиске решения была платформа с интеграцией API, которая могла бы беспрепятственно работать с Award Force, программным обеспечением для управления наградами, используемым для конкурса. Еще одной проблемой была эффективная и тщательная отчетность, документация и способность обрабатывать большие объемы контента и данных.
В 2018 году НСС начала работать с платформой Copyleaks, используя интеграцию API для обнаружения потенциального плагиата в конкурсных материалах. При каждом сканировании через систему Awards Force генерируется подозрительный балл, позволяющий судьям быстрее и более обоснованно принимать решения о возможном плагиате. В результате время обработки сократилось с недель или месяцев до нескольких дней.
Мэтью Дж. Левин, директор конкурса космических поселений имени Джерарда К. О'Нила НСС
NSS начала считать, что если оценка подозреваемого равна 0%, это автоматический пропуск; если это был 5% или выше, обычно это был автоматический сбой. Все, что находится между 0-5%, требовало дальнейшего изучения посредством более глубокого анализа с использованием отчета о сходстве Copyleaks, создаваемого при каждом сканировании. В каждом отчете есть показатель сходства (рассчитывается иначе, чем вышеупомянутый показатель подозрительности), который позволяет более глубоко анализировать похожий текст, обнаруженный в отсканированном документе. Эта разбивка отчетов позволяет судьям сравнивать тексты друг с другом и определять, был ли контент плагиатом.
NSS также использует репозиторий Copyleaks, который позволяет им хранить все отсканированные материалы в безопасной частной базе данных, которую можно использовать для будущих сканирований для сравнения, чтобы гарантировать, что ни один участник не занимался плагиатом прошлых победивших работ.
Начиная с Copyleaks, NSS смогла гораздо быстрее и точнее обнаруживать плагиат в конкурсных материалах. Например, в 2023 году из 4567 заявок 1894 были дисквалифицированы за плагиат, что значительно больше, чем когда задание выполнялось вручную.
NSS также рассматривает, как контент, созданный искусственным интеллектом от чат-ботов, таких как ChatGPT, повлияет на конкурс космических поселений Джерарда К. О'Нила и его заявки, а также изучает возможность использования детектора контента искусственного интеллекта Copyleaks в качестве новой части процесса судейства.