وجد بحث Copyleaks أن ما يقرب من 60% من مخرجات GPT-3.5 تحتوي على شكل من أشكال المحتوى المسروق

نيويورك، نيويورك – 22 فبراير 2024 وفقا ل 2023 تقريربحلول عام 2026، سيتم إنشاء ما يقرب من 90% من جميع المحتوى عبر الإنترنت بواسطة الذكاء الاصطناعي. نتيجة لتشبع محتوى الذكاء الاصطناعي، فإن المخاوف بشأن تلوث البيانات أمر لا مفر منه انهيار النموذج إثارة المخاوف بشأن الجودة الشاملة والموثوقية للنص الناتج عن الذكاء الاصطناعي.

 

علاوة على ذلك، بدأت أيضًا مخاوف أوسع نطاقًا بشأن الأصالة. في أعقاب عدة دعاوى قضائية فيما يتعلق بانتهاك الذكاء الاصطناعي لحقوق الطبع والنشر واحتمال السرقة الأدبية، تتساءل المؤسسات التعليمية والمؤسسات في جميع أنحاء العالم عن صحة نص الذكاء الاصطناعي: من أين نشأ؟ هل من الآمن استخدامه كمحتوى أصلي؟

 

في النهاية، هل يقوم الذكاء الاصطناعي بالسرقة؟

 

تجده في الخارج، Copyleaks, الشركة الرائدة في مجال تحديد الانتحال، واكتشاف محتوى الذكاء الاصطناعي، وحوكمة GenAI، أجرى تحليلًا لتحديد مدى كون المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي أصليًا وخاليًا من السرقة الأدبية المحتملة.

 

لإجراء هذا التحليل:

 

طلب Copyleaks من GPT-3.5 أن يكتب 1,045 مخرجًا، في المتوسط 412 كلمة عبر جميع النواتج، في 26 مادة: الفيزياء، الكيمياء، العلوم، علم النفس، القانون، الاقتصاد، الأحياء، دراسات الأعمال، الهندسة، المحاسبة، الجغرافيا، الرياضيات، علوم الكمبيوتر، الرياضة، تاريخ العالم، الفلسفة، اللغة الإنجليزية، الفن، التربية البدنية، الإحصاء، العلوم الاجتماعية، الطبيعة ، الموسيقى، علم الاجتماع، العلوم الإنسانية، المسرح. 

 

قام Copyleaks بقياس المخرجات المحددة بأعلى مستويات النص المتطابق (نسخة واحدة لنص من نص شخص آخر تم تمريره على أنه نص خاص بك)، وتغييرات طفيفة (المحتوى مع تعديلات طفيفة على المادة المصدر، مثل تغيير الفعل ضمن جملة (على سبيل المثال، بطيء إلى بطيء)، وإعادة الصياغة (وضع فكرة شخص آخر في كلماتك الخاصة دون الاعتماد على المصدر الأصلي) في جميع المواضيع الـ 26. 

 

وتشمل النتائج الرئيسية للتحليل ما يلي:

 

  • احتوت 59.7% من مخرجات GPT-3.5 على شكل من أشكال المحتوى المسروق. يحتوي 45.7% من جميع المخرجات على نص متطابق، ويحتوي 27.4% على تغييرات طفيفة، ويحتوي 46.5% على نص مُعاد صياغته. وهذا يسلط الضوء أيضًا على أن GPT-3.5 لا يقوم بتصنيع نص "جديد تمامًا"؛ يأتي معظم المحتوى من مصدر سابق، مما يثير قضايا حول الانتحال وحقوق النشر والملكية الفكرية.

     

  • كان مخرج GPT-3.5 الفردي صاحب أعلى نسبة سرقة أدبية في الفيزياء، حيث كان 27.0% من النص متطابقًا. تبع ذلك إخراج كيمياء فردي حيث كان 24.7% من النص متطابقًا.

     

  • فحص التحليل أيضًا درجات التشابه. نقاط التشابه هي طريقة تسجيل خاصة بـ Copyleaks تجمع معدل النص المتطابق والتغييرات الطفيفة والنص المعاد صياغته والمزيد. تشير الدرجة 0% إلى أن كل المحتوى أصلي، في حين تعني الدرجة 100% أن أيًا من المحتوى ليس أصليًا.
     
  • كانت المادة التي حصلت على أعلى متوسط نقاط تشابه هي الفيزياء بمعدل 31.3%، يليها علم النفس بدرجة 27.7% والعلوم بدرجة 26.7%. وكانت المواضيع التي حصلت على أدنى متوسط لنقاط التشابه هي المسرح عند 0.9%، والعلوم الإنسانية عند 2.8%، واللغة الإنجليزية عند 5.4%.

     

وقال ألون يامين، الرئيس التنفيذي والمؤسس المشارك: "يمكن للرؤى التي يقدمها التحليل أن تساعد المؤسسات والمنظمات التعليمية على التركيز على موضوعات معينة عند التحقق من السرقة الفكرية، مما يسمح لها بتكييف نهجها حسب الحاجة لضمان معالجة جميع المخاطر والمخاوف المحتملة". من Copyleaks. "على سبيل المثال، قد تتطلب الفيزياء والكيمياء والرياضيات وعلم النفس نظرة أكثر تعمقًا لتحديد النص المسروق، في حين أن المواضيع الأخرى، بما في ذلك المسرح والعلوم الإنسانية، قد تتطلب قدرًا أقل من التدقيق."

 

وأضاف يامين: "علاوة على ذلك، تؤكد البيانات على حاجة المؤسسات إلى اعتماد حلول تكتشف وجود المحتوى الناتج عن الذكاء الاصطناعي وتوفر الشفافية اللازمة المحيطة بالسرقة الأدبية المحتملة داخل محتوى الذكاء الاصطناعي. وتضمن الحماية الكاملة التي تتضمن الذكاء الاصطناعي والكشف عن الانتحال الامتثال لحقوق الطبع والنشر والترخيص وتمكين الأصالة والأصالة في كل المحتوى.

###

حوالي Copyleaks

مكرسة لإنشاء بيئات آمنة لمشاركة الأفكار والتعلم بثقة، Copyleaks هي شركة لتحليل النصوص تعتمد على الذكاء الاصطناعي وتستخدمها الشركات والمؤسسات التعليمية وملايين الأفراد حول العالم لتحديد الانتحال المحتمل في أكثر من 100 لغة، والكشف عن المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي، ضمان اعتماد الذكاء الاصطناعي بشكل مسؤول، والتحقق من الأصالة والملكية، وتمكين الكتابة الخالية من الأخطاء.

للحصول على معلومات إضافية، قم بزيارة موقعنا موقع إلكتروني أو تابعونا على ينكدين.