Copyleaks Araştırması, GPT-3.5 Çıktılarının Yaklaşık 60%'sinin Bir Tür İntihal İçerik İçerdiğini Buldu

New York, NY – 22 Şubat 2024 – 2023'e göre rapor2026 yılına kadar tüm çevrimiçi içeriğin yaklaşık 90%'si yapay zeka tarafından oluşturulacak. Yapay zeka içerik doygunluğunun bir sonucu olarak, veri kirliliğine ilişkin endişeler ve kaçınılmaz model çöküşü Yapay zeka tarafından oluşturulan metnin genel kalitesi ve güvenilirliği hakkında endişeler uyandırıyor.

Üstelik özgünlük konusunda daha geniş kaygılar da başladı. Ardından birkaç dava Yapay zekanın telif haklarını ihlal etmesi ve potansiyel olarak intihal yapmasıyla ilgili olarak dünya çapındaki eğitim kurumları ve işletmeler yapay zeka metninin gerçekliğini sorguluyor: Nereden geldi? Orijinal içerik olarak kullanmak güvenli midir?

Sonuçta yapay zeka intihal yapıyor mu?

Öğrenmek için Copyleaks, İntihal tespiti, AI içerik tespiti ve GenAI yönetişiminde lider, Yapay zeka tarafından oluşturulan içeriğin ne ölçüde orijinal olduğunu ve potansiyel intihal içermediğini belirlemek için bir analiz gerçekleştirdi.

Bu analizi gerçekleştirmek için:

Copyleaks, GPT-3.5'ten yazmasını istedi 1.045 çıkış, ortalama 412 kelime tüm çıktılarda, 26 konu: Fizik, Kimya, Bilim, Psikoloji, Hukuk, Ekonomi, Biyoloji, İşletme Çalışmaları, Mühendislik, Muhasebe, Coğrafya, Matematik, Bilgisayar Bilimleri, Spor, Dünya Tarihi, Felsefe, İngiliz Dili, Sanat, Beden Eğitimi, İstatistik, Sosyal Bilimler, Doğa , Müzik, Sosyoloji, Beşeri Bilimler, Tiyatro.

Copyleaks, belirli çıktıları en yüksek düzeyde aynı metinle (Başka birinin metninin sizinki gibi aktarılan bire bir kopyalanması), küçük değişikliklerle (Bir fiilin değiştirilmesi gibi kaynak materyalde küçük değişiklikler içeren içerik) ölçtü. 26 konunun tamamında bir cümle içinde (örneğin, yavaştan yavaşa) ve başka kelimelerle ifade etme (orijinal kaynağa atıfta bulunmadan başkasının fikrini kendi kelimelerinizle ifade etmek).

Analizden elde edilen temel bulgular şunlardır:

GPT-3.5 çıktılarının 59.7%'si bir tür intihal içerik içeriyordu. Tüm çıktıların 45.7%'si aynı metni içeriyordu, 27.4%'si küçük değişiklikler içeriyordu ve 46.5%'si başka kelimelerle yazılmış metin içeriyordu. Bu aynı zamanda GPT-3.5'in "yepyeni" metin üretmediğini de vurgulamaktadır; içeriğin çoğu önceki bir kaynaktan geliyor ve intihal, telif hakkı ve fikri mülkiyetle ilgili sorunları gündeme getiriyor.

En yüksek intihal yüzdesine sahip bireysel GPT-3.5 çıktısı, metnin 27.0%'sinin aynı olduğu Fizik bölümündeydi. Bunu, metnin 24.7%'sinin aynı olduğu ayrı bir Kimya çıktısı izledi.

Analiz aynı zamanda Benzerlik Puanlarını da inceledi. Benzerlik Puanı, aynı metin, küçük değişiklikler, başka kelimelerle yazılmış metin ve daha fazlasının oranını toplayan Copyleaks'ye özgü bir puanlama yöntemidir. 0% puanı içeriğin tamamının orijinal olduğunu, 100% puanı ise içeriğin hiçbirinin orijinal olmadığını gösterir.

En yüksek ortalama Benzerlik Puanına sahip konu 31,3% ile Fizik olurken, onu 27,7% ile Psikoloji ve 26,7% ile Bilim takip etti. En düşük ortalama Benzerlik Puanına sahip konular 0,9% ile Tiyatro, 2,8% ile Beşeri Bilimler ve 5,4% ile İngiliz Dili oldu.

Analizin sağladığı bilgiler, eğitim kurumlarının ve kuruluşlarının intihal kontrolü yaparken belirli konulara vurgu yapmasına yardımcı olabilir ve tüm potansiyel risklerin ve endişelerin ele alındığından emin olmak için yaklaşımlarını gerektiği gibi uyarlamalarına olanak tanıyabilir" dedi CEO ve Kurucu Ortak Alon Yamin. Copyleaks'nin. "Örneğin Fizik, Kimya, Matematik ve Psikoloji, çalıntı metni tespit etmek için daha derinlemesine bir inceleme gerektirebilirken, Tiyatro ve Beşeri Bilimler de dahil olmak üzere diğer konular daha az inceleme gerektirebilir."

Yamin şunları ekledi: "Ayrıca veriler, kuruluşların yapay zeka tarafından oluşturulan içeriğin varlığını tespit eden ve yapay zeka içeriğindeki potansiyel intihal konusunda gerekli şeffaflığı sağlayan çözümleri benimseme ihtiyacının altını çiziyor. Yapay zeka ve intihal tespitini içeren tam spektrumlu koruma, telif hakkı ve lisanslamayla uyumluluğu sağlar ve tüm içeriğin orijinalliğini ve orijinalliğini güçlendirir."

###

Copyleaks Hakkında

Fikirleri paylaşmak ve güvenle öğrenmek için güvenli ortamlar yaratmaya adanmış Copyleaks, dünya çapında işletmeler, eğitim kurumları ve milyonlarca kişi tarafından 100'den fazla dilde potansiyel intihalleri tespit etmek, yapay zeka tarafından oluşturulan içeriği ortaya çıkarmak için kullanılan yapay zeka tabanlı bir metin analiz şirketidir. Sorumlu, üretken yapay zekanın benimsenmesini sağlayın, özgünlüğü ve sahipliği doğrulayın ve hatasız yazmayı güçlendirin.

Daha fazla bilgi için web sitemizi ziyaret edin. İnternet sitesi veya bizi takip edin LinkedIn.