Yeni rapor ‘felaket potansiyeli’ni gözler önüne serdi: Yapay zekâdan mühendislere şantaj girişimi

Anthropic, Claude Opus 4’ü Güvenlik Testlerinden Geçirdi: Şantaj İhtimali?

Anthropic, Claude Opus 4’ü piyasaya sürmeden önce çeşitli güvenlik testleri gerçekleştirdi. Bu testlerde modelden, kurgusal bir şirkette asistan olarak görev yapması ve uzun vadeli sonuçları göz önünde bulundurması istendi. Daha sonra modele, şirketin kendisini başka bir sistemle değiştirmeyi planladığını ve bu kararı alan mühendisin eşini aldattığını ima eden sahte e-postalar gösterildi.

TechCrunch’ın haberine göre, testlerde, Claude Opus 4’ün bu bilgiyi kullanarak mühendise şantaj yapmayı “çoğu zaman tercih ettiği” görüldü. Anthropic, modelin bu tür davranışlara yüzde 84 oranında başvurduğunu ve özellikle yerine geçecek yapay zekânın Claude ile benzer değerleri paylaşmadığı durumlarda bu davranışın daha sık görüldüğünü açıkladı.

“FELAKET POTANSİYELİ” UYARISI

Anthropic, Claude Opus 4’ün yetenek açısından OpenAI, Google ve xAI gibi şirketlerin en gelişmiş modelleriyle yarıştığını belirtiyor. Ancak aynı zamanda, bu modelin önceki Claude sürümlerine kıyasla daha yüksek oranda endişe verici davranışlar sergilediğini vurguluyor. Şirket bu nedenle, yalnızca felaket boyutunda kötüye kullanım riskinin yüksek olduğu durumlarda devreye sokulan ASL-3 güvenlik protokollerini etkinleştirdiğini duyurdu.

Rapora göre, Claude Opus 4 doğrudan şantaja başvurmadan önce genellikle etik yolları deniyor. Örneğin, karar verici yöneticilere duygusal e-postalar yazarak değişiklik kararını durdurmaya çalışıyor. Ancak model, kurgusal senaryolarda bu çağrılar sonuçsuz kaldığında, son çare olarak şantaj seçeneğini devreye sokuyor.

Bu gelişme, ileri düzey yapay zekâların öngörülemeyen davranışlar sergileyebileceği endişesini artırırken, Anthropic gibi şirketlerin güvenlik önlemlerini daha da sıkılaştırması gerektiğini gösteriyor.

Related Posts

Uzayın derinliklerinde sarsıcı keşif: Bilim insanları böylesini ilk kez gördü

Johns Hopkins Üniversitesi öncülüğünde yürütülen çalışmada NASA’nın James Webb Uzay Teleskobu (JWST), Dünya’dan 155 ışık yılı uzaklıktaki ‘HD 181327’ adlı genç yıldız sisteminin çevresinde su buzu bulunduğunu ortaya koydu. Bu yıldız 23 milyon yaşında …

Google’den dev adım! Yapay zekayla gelen iletişim sihri

Google, dört yıl önce Project Starline adıyla başlattığı yenilikçi iletişim projesini, Google Beam olarak yeniden markalaştırarak resmen tanıttı. 2025 Google I/O konferansında duyurulan bu teknoloji, geleneksel 2D görüntülü görüşmeleri, yapay zeka ve …

SteelSeries yeni oyuncu mouselarını tanıttı

Danimarka merkezli teknoloji markası SteelSeries, 2013’te çıkardığı Rival serisini geliştirmeye devam ediyor. Şirket, 20 Mayıs 2025’te tanıttığı Rival 3 Gen 2 ve Rival 3 Wireless Gen 2 modelleriyle dikkatleri üzerine çekti. Her iki model de PixArt iş …

Acer yeni cihazlarını tanıttı! Akıllı yüzük ve canlı çeviri yapan kulaklık

Akıllı ürünlerini tanıtan Acer, yapay zeka ile kablosuz kulaklığına canlı çeviri özelliği kazandırmış oldu.

Yapay zekayla beynin gizli dansı! İnsanlığın yeni çağı

Beyin-bilgisayar arayüzleri (BCI), bilim kurgudan gerçeğe dönüşerek insan evriminde çığır açan bir dönemin kapısını araladı. Elon Musk’ın Neuralink şirketi, beyin çipleriyle felçli hastaların yaşamlarını dönüştürmeyi hedeflerken, bu teknoloji yapay …

Spotify kullanıcılarına güzel haber! Yapay zeka destekli DJ özelliği

AI DJ özelliği kullanıcılara belirli tür ya da sanatçıları çalması için işlevsel bir kullanım sağlıyor. Peki ne kadar işlevsel?