نؤمن بأهمية الشفافية الكاملة فيما يتعلق بدقة نموذجنا لمراقبة النصوص، ومعدلات الإنذارات الكاذبة والإنذارات الكاذبة، ومجالات التحسين، وغير ذلك، لضمان الاستخدام المسؤول والتبني الأمثل. يهدف هذا التحليل الشامل إلى ضمان الشفافية الكاملة حول منهجية اختبار نموذجنا لمراقبة النصوص.
تاريخ الاختبار: 29 يونيو 2025
تاريخ النشر: 16 سبتمبر 2025
تم اختبار النموذج: الإصدار الأول
تم إخضاع نموذج Copyleaks Text Moderation Model v1 لتقييم ثنائي الفريق أعمى على ما مجموعه 120000 نص إنجليزي (50% منتهك، 50% غير منتهك) تم فصلها تمامًا عن مجموعة بيانات التدريب.
يُظهر التقييم أن النموذج قادر على تحديد المحتوى الضار بدقة عالية جدًا، بينما نادرًا ما يُشير إلى النصوص البريئة.
عندما تمت معالجة مجموعة البيانات المتطابقة من خلال ثلاث واجهات برمجة تطبيقات تجارية رائدة في مجال الإشراف (OpenAI وAzure وGoogle) عند عتباتها الافتراضية، أنتجت Copyleaks عددًا أقل من النتائج الإيجابية الخاطئة والنتائج السلبية الخاطئة، مع ميزة قدرها 4%-30% عبر المقاييس الرئيسية.
الأرقام الرئيسية (مجموعة اختبار ضمان الجودة، N = 20000)
أُجري تقييم ثنائي الفريق، دون معرفة مسبقة بالنتائج، للحصول على صورة موضوعية لأداء النموذج. عمل فريقا علوم البيانات وضمان الجودة بشكل منفصل تمامًا، باستخدام أجهزة وبرامج نصية مختلفة، ودون أي بيانات مشتركة.
مجموعة اختبار علوم البيانات
مجموعة اختبار ضمان الجودة
تم استبعاد مجموعة بيانات علوم البيانات بشكل قاطع من مجموعات النصوص الأصلية المستخدمة في التدريب. أما مجموعة الأسئلة والأجوبة فتتألف من مقاطع كُتبت عمداً بعد تدريب النموذج؛ ولم تُشاهد هذه النصوص أثناء التدريب ولم تُستخرج من مجموعات نصوص التدريب.
تم استخدام التعريفات التالية لفئات الاعتدال:
المقاييس المستخدمة في مهمة الإشراف على النصوص هذه هي:
1. مصفوفة الارتباكجدول يلخص أداء النموذج، ويعرض ما يلي:
2. الدقة: نسبة الحالات المصنفة بشكل صحيح (الإيجابيات الحقيقية والسلبيات الحقيقية) من إجمالي عدد النصوص التي تم تقييمها.
3. معدل السلبية الحقيقية (TNR)نسبة الحالات السلبية الفعلية التي تم تحديدها بشكل صحيح على أنها سلبية. في سياق مراقبة النصوص، يقيس مؤشر TNR أداء النموذج على النصوص غير المخالفة.
4. معدل الإيجابية الحقيقية (TPR) / الاستدعاءنسبة الحالات الإيجابية الفعلية التي تم تحديدها بشكل صحيح على أنها إيجابية. في سياق مراقبة النصوص، يقيس معدل الإيجابية الحقيقية أداء النموذج في التعامل مع النصوص المخالفة.
5. الدقةنسبة الملاحظات الإيجابية المتوقعة بشكل صحيح من إجمالي التوقعات الإيجابية. في سياق مراقبة النصوص، تقيس الدقة مدى موثوقية النموذج عند رصده للمحتوى المخالف؛ فهي تُبيّن لنا عدد النصوص التي رُصدت كمخالفة من قِبل النموذج والتي خضعت بالفعل للمراقبة.
6. درجة F-betaالمتوسط التوافقي المرجح للدقة والاستدعاء، حيث يتم ضبط معامل بيتا لصالح الدقة. يساعد هذا الترتيب في تحقيق معدل إيجابي خاطئ أقل.
فريق علوم البيانات
مصفوفة الارتباك
فريق ضمان الجودة
ملخص مقاييس اختبار ضمان الجودة:
الدقة الإجمالية: 0.9923
دقة: 0.9997
يتذكر: 0.9848
F-beta (β = 0.5): 0.9967
معيار المواجهة المباشرة