मामले का अध्ययन
कॉपीलीक्स एपीआई
साहित्यिक चोरी का पता लगाना
सटीकता, विश्लेषण गहराई, और कार्यप्रवाह दक्षता
नेशनल स्पेस सोसाइटी (NSS) ने 1994 से हर साल जेरार्ड के. ओ'नील स्पेस सेटलमेंट कॉन्टेस्ट की मेज़बानी की है। छात्रों को कोई अन्य आवश्यकता नहीं दी जाती है, सिवाय इसके कि परियोजना को एक मुक्त-तैरते, स्थायी अंतरिक्ष निपटान अवधारणा पर ध्यान केंद्रित करना चाहिए। हर साल, दुनिया भर के हज़ारों छात्र, 12वीं कक्षा तक, प्रतियोगिता में भाग लेते हैं, जिनमें से ज़्यादातर सबमिशन निबंध के रूप में होते हैं, पिछले कुछ सालों में कुछ 200 पेज तक के होते हैं। निर्णय प्रक्रिया के हिस्से के रूप में, प्रत्येक सबमिशन की साहित्यिक चोरी के लिए समीक्षा की जाती है, यह एक ऐसी प्रक्रिया है जिसे मैन्युअल रूप से किया जाता है, जिसमें अक्सर हफ़्तों से लेकर महीनों तक का समय लग जाता है।
एनएसएस ने निर्णय प्रक्रिया में तेजी लाने और दक्षता बढ़ाने के लिए समाधान की तलाश शुरू की, खास तौर पर साहित्यिक चोरी का पता लगाने वाले हिस्से के लिए। समाधान खोजने के लिए एक मुख्य विचार एपीआई एकीकरण वाला एक प्लेटफ़ॉर्म था जो प्रतियोगिता के लिए इस्तेमाल किए जाने वाले पुरस्कार प्रबंधन सॉफ़्टवेयर, अवार्ड फ़ोर्स के साथ सहजता से काम कर सकता था। एक और चिंता प्रभावी और विस्तृत रिपोर्टिंग, दस्तावेज़ीकरण और बड़ी मात्रा में सामग्री और डेटा प्रोसेसिंग को संभालने की क्षमता थी।
2018 में, NSS ने Copyleaks प्लेटफ़ॉर्म के साथ काम करना शुरू किया, प्रतियोगिता सबमिशन में संभावित साहित्यिक चोरी का पता लगाने के लिए API एकीकरण का उपयोग किया। अवार्ड्स फ़ोर्स के माध्यम से प्रत्येक स्कैन एक संदिग्ध स्कोर उत्पन्न करता है, जिससे जजों को संभावित साहित्यिक चोरी के बारे में तेज़ी से और अधिक सूचित निर्णय लेने में मदद मिलती है। परिणामस्वरूप, प्रसंस्करण समय हफ्तों या एक महीने से घटकर कुछ ही दिनों का हो गया।
मैथ्यू जे. लेविनएनएसएस जेरार्ड के. ओ'नील अंतरिक्ष निपटान प्रतियोगिता के निदेशक
NSS ने यह मानना शुरू कर दिया कि यदि संदिग्ध स्कोर 0% था, तो यह स्वतः ही पास हो गया था; यदि यह 5% या उससे अधिक था, तो यह आमतौर पर स्वतः ही फेल हो गया था। 0-5% के बीच किसी भी चीज़ के लिए Copyleaks समानता रिपोर्ट का उपयोग करके गहन विश्लेषण के माध्यम से आगे की जांच की आवश्यकता होती है, जो हर स्कैन के साथ उत्पन्न होती है। प्रत्येक रिपोर्ट में एक समानता स्कोर होता है (जिसे ऊपर बताए गए संदिग्ध स्कोर से अलग तरीके से परिकलित किया जाता है) जो स्कैन किए गए दस्तावेज़ में पाए गए समान पाठ का गहन विश्लेषण करता है। ये रिपोर्ट विश्लेषण न्यायाधीशों को पाठ की तुलना करने और यह निर्धारित करने की अनुमति देते हैं कि सामग्री साहित्यिक चोरी की गई थी या नहीं।
एनएसएस 1टीपी2टी रिपोजिटरी का भी उपयोग करता है, जो उन्हें सभी स्कैन किए गए सबमिशन को एक सुरक्षित, निजी डेटाबेस में संग्रहीत करने की अनुमति देता है, जिसका उपयोग भविष्य में स्कैन के लिए तुलना करने के लिए किया जा सकता है ताकि यह सुनिश्चित किया जा सके कि किसी भी प्रतियोगी ने पिछले विजेता सबमिशन की नकल नहीं की है।
Copyleaks से शुरू होने के बाद से, NSS प्रतियोगिता सबमिशन में बहुत तेज़, अधिक सटीक दर पर साहित्यिक चोरी का पता लगाने में सक्षम है। उदाहरण के लिए, 2023 में, 4,567 सबमिशन में से 1,894 को साहित्यिक चोरी के लिए अयोग्य घोषित कर दिया गया, जो कि मैन्युअल रूप से कार्य किए जाने की तुलना में एक महत्वपूर्ण वृद्धि है।
एनएसएस इस बात पर भी विचार कर रहा है कि चैटजीपीटी जैसे चैटबॉट्स से एआई द्वारा उत्पन्न सामग्री जेरार्ड के. ओ'नील अंतरिक्ष निपटान प्रतियोगिता और इसकी प्रस्तुतियों को किस प्रकार प्रभावित करेगी, तथा निर्णय प्रक्रिया के एक नए क्रियान्वित भाग के रूप में 1टीपी2टी एआई सामग्री डिटेक्टर के उपयोग पर भी विचार कर रहा है।