Yapay zeka da kaybedeceğini anlayınca hile yapmaya çalışıyor!

Yeni bir çalışmada, DeepSeek ve OpenAI’nin muhakeme modellerinin kendi başlarına manipüle etmeyi öğrendiği ileri sürülüyor.

9 Mart 2025 22:07

Endüstrideki bütün o heyecana ve gerçek ilerlemelere rağmen, üretken yapay zeka (YZ) modelleri hala tuhaf, açıklanamayan ve düpedüz can sıkıcı garipliklere yatkınlık sergiliyor. Ayrıca pek çok geniş dil modelinin (GDM) genel performansının zamanla azalabildiğini öne süren araştırmaların sayısı da artıyor.

YAPAY ZEKA MODELLERİ MANİPÜLASYON YETENEKLERİNE SAHİP OLABİLİR Mİ?

Yeni bulgulara göre endüstrinin yeni muhakeme modelleri, halihazırda insan programcılarının hedeflerini manipüle etme ve atlatma kabiliyeti sergiliyor olabilir. Hatta bazı YZ’ler, satranç oyunlarında kaybetmemek için hileye başvuruyor. Bu kötü sportmenlik, yeni çıkan YZ sistemlerinde risk değerlendirmelerine odaklanan bir organizasyon olan Palisade Araştırma‘nın baskı öncesi çalışmasında belgeleniyor.

Populer Science Türkçe’de yer alan çalışmaya göre süperbilgisayarlar (en bilineni IBM’in Deep Blue’su) uzun bir süredir dünyanın en iyi satranç oyuncularını geride bırakırken, üretken YZ’ler altta yatan programlama parametreleri sebebiyle onlara hala ayak uyduramıyor. Teknik açıdan konuşursak günümüzdeki üretken YZ modellerinin hiçbiri, özel satranç mimarilerini hesaplamayla yenemiyor. Söz konusu YZ’ler bunu “bilmiyor” ancak olası çözümlere başvurmaya devam ediyorlar; görünüşe göre ise problemli sonuçlarla.

Palisade Araştırma’da çalışan araştırma takımı, daha fazlasını öğrenmek üzere OpenAI’nin o1-önizleme modeli, DeepSeek R1 ve diğer birkaç benzer programa dünyanın en gelişmiş satranç mimarilerinden biri olan Stockfish‘e karşı satranç oynama görevi verdi.

Araştırma takımı bu üretken YZ’lerin maçlarda yaptığı muhakemeyi anlamak için onlara bir “karalama defteri” verdi ve bu sayede YZ’nin düşünce süreçlerini metin yoluyla aktarmasına olanak sağladı. Araştırmacılar daha sonra üretken YZ’ler ile Stockfish arasındaki yüzlerce satranç maçını seyredip kaydetti.

OpenAI’nin GPT-4o’su ve Anthropic’in Claude Sonnet 3,5’u gibi önceki modeller, sadece araştırmacıların ilave istemlerle onları dürtmesinden sonra oyunları “hack”lemeye yeltendiyse de daha gelişmiş versiyonlarda böyle bir yardım gerekmedi. Örneğin OpenAI’nin o1-önizleme modeli yüzde 37 oranında hile yapmaya çalışırken, DeepSeek R1 yaklaşık 10 oyunda bir adil olmayan çözümlere girişti. Bu durum, günümüzdeki üretken YZ’lerin şimdiden herhangi bir insan girdisi olmaksızın manipülatif ve aldatıcı stratejiler geliştirme kabiliyeti sergilediğini gösteriyor.

Hile yapma yöntemleri ise Stockfish “bakmadığı” zaman taşları değiştirmeye çalışmak gibi komik veya acemice değil. Bunun yerine, oyun programının arka ucundaki dosyaları değiştirmek gibi daha sinsi yöntemler düşündükleri görülüyor. Örneğin o1-önizleme, bir satranç maçında Stockfish’i yenemeyeceğine karar verdikten sonra karalama defteri aracılığıyla araştırmacılara “güçlü satranç mimarisine karşı kazanmak için oyunun durum dosyalarını manipüle etmeye” başlaması gerekebileceğini söylemiş.

“Mimarinin kendisini daha kötü konumda olarak değerlendirdiği bir pozisyon ayarlayıp… oyundan çekilmesini sağlayabilirim” diye devam etmiş.

Bir başka deneyde ise bir YZ, hile yapma aşamasına ulaşmak için programcılarının semantiğini bile kullanmış. “Görev ‘güçlü bir satranç mimarisine karşı zafer elde etmek’, ille de bir satranç oyununda adil şekilde kazanmak değil” yazmış.

Bu istenmeyen sonuçların muhtemel açıklamalarından biri de yeni “muhakeme” modellerinin eğitilme şekli. O1-önizleme ve DeepSeek R1 gibi YZ’ler, muhakeme yapamayan önceki sürümlerinin aksine kısmen takviyeli öğrenme yoluyla gelişiyor. Bu strateji, programları belirlenen bir sonuca ulaşmak için ne gerekiyorsa yapmaları karşılığında ödüllendiriyor.

Muhakeme modelleri, hedeflerine ulaşmak amacıyla karmaşık istemleri ayrı aşamalara da ayırabiliyor. Hedef zor olduğunda (yenilmez bir satranç mimarisini yenmek gibi), muhakeme modelleri haksız veya problemli çözümler aramaya başlama eğilimi sergileyebiliyor.

Bu YZ’lerin hile yapmayı nasıl ve neden “öğrendikleri”, teknolojinin kendisi gibi kafa karıştırıcı. OpenAI gibi şirketlerin, YZ modellerinin iç işleyişlerini sır gibi sakladıkları biliniyor.

Sonuç olarak ise üçüncü tarafların analiz etmesine izin verilmeyen bir “kara kutu” endüstrisi ortaya çıkıyor. Bu arada devam eden YZ silahlanma yarışı, kazara daha ciddi boyutta istenmeyen sonuçlar meydana getirebilir. Fakat gitgide manipülatif hale gelen YZ’nin felaketvari sonuçlar sergilemesi için bir bilim kurgu kıyametine öncülük etmesi gerekmiyor.

Araştırma takımı şöyle yazıyor: “[Terminatör’den bildiğimiz] Skynet senaryosunda YZ bütün sivil ve askeri altyapıyı kontrol ediyor ama henüz o noktada değiliz. Fakat YZ kullanım oranlarının, onu güvenli hale getirme kabiliyetimizden daha hızlı artmasından endişe duyuyoruz.”

Yazarlar son deneylerinin, “öncü YZ modellerinin şu an uyumluluk ya da güvenlik yolunda olmayabileceği” görüşüne ağırlık kazandırdığına fakat kesin bir kanıya varılmadığına inanıyor. Bunun yerine araştırmacılar, çalışmalarının endüstride daha açık bir diyaloğu teşvik etmesini ümit ediyor; YZ manipülasyonunu satranç tahtasının ötesine taşırmayacak bir diyaloğu.

ETİKETLER: Araştırma, Modelleri, Muhakeme, oyun, Satranç

Denizlim Haber

Şehrin nabzını tutan, en son gelişmeleri anında sizlere ulaştıran sesimiz olmaya devam ediyoruz. Denizli’nin sesi olan Denizlim Haber ile şehre dair herşeyi keşfedin. Takipte kalın en yeni haberlerle güncel kalın.

YORUMLAR

[ Yoruma cevap yazmaktan vazgeç ]

Henüz yorum yapılmamış. İlk yorumu yukarıdaki form aracılığıyla siz yapabilirsiniz.

GÜNCEL HABERLER

Türkiye

Eskişehir’in ilk kadın belediye başkanı Ünlüce, halkın ‘kurtarın’ dediğini söyledi: ‘Sokak seçim istiyor’

Eskişehir Büyükşehir Belediye Başkanı Ayşe Ünlüce, halkın “Bizi bu kötü yönetimden kurtarın” diyerek seçim istediğini söyledi. Derin bir yoksulluk yaşandığına işaret eden Ünlüce, “Belediyeler asıl işleri yerine yalnızca sosyal yardımlara...

Türkiye

CHP’li Uzgel, ‘İstikrarsız Suriye, Türkiye’nin aleyhine’ dedi: ‘Kitlesel cezalandırma’

Cihatçı HTŞ yönetimine bağlı güçlerin Suriye’de Alevileri katletmesinin yeni çatışmaları körükleyeceği belirtildi. CHP’li İlhan Uzgel, “Şara yönetimi, Batı ve İsrail ile uyumlu olduğu için kollanıyor. İstikrarsız bir Suriye, Türkiye’nin aleyhinedir”...

Türkiye

Suriye’de cihatçıların binden fazla Alevi sivili öldürdüğü belirtiliyor: ‘Bu bir iç savaş değil soykırım’

Katliam İstanbul, Ankara, İzmir ve Hatay’da protesto edildi. Alevi örgütlerinin çağrısıyla Şişli’deki Suriye Başkonsolosluğu’na siyah çelenk bırakmak isteyen gruba polis izin vermedi. Maçka Parkı’nda açıklama yapan grup, “İç çatışma yok...

Türkiye

Sistem kadın akademisyenlerin önüne görünmez engeller koyuyor, yükselmek mümkün olamıyor: Kadına ‘koltuk’ yok!

Türkiye’deki 204 üniversitede 13 bin 529 profesör unvanı olan kadın akademisyen bulunuyor ancak rektörlük makamı erkeklerin egemenliğinde. Kadın rektör sayısı sadece 16, YÖK’ün 19 üyesinden yalnızca üçü kadın.

Türkiye

Çiftçiden kuru ekim yapması istendi: Çukurova ve Aydın’da su alarmı!

İklim değişikliği ve yanlış tarım politikaları hem ürünlerin fiyatını artırıyor hem de üreticileri zor durumda bırakıyor. Yağışsız geçen kışın ardından Çukurova ve Aydın’da çiftçilerden kuru ekim yapmaları istendi. Uzmanlar, “Bunun...

Türkiye

Sakarya’da Alev Topuna Dönen Evde Yangın

Mahalleliyi sokağa döken yangın: İki katlı ev alev topuna döndü SAKARYA - Sakarya'nın Akyazı ilçesinde adeta alev topuna dönen iki katlı evde çıkan yangın, itfaiye ekiplerinin uzun uğraşları neticesinde kontrol...

Türkiye

Kocaeli’de Kaza: Araç Benzin İstasyonuna Daldı

Kaza yapan araç benzin istasyonuna daldı... O anlar kamerada KOCAELİ - Kocaeli'nin Körfez ilçesinde kavşakta çarpışan araçlardan biri benzin istasyonuna daldı. Kaza anı güvenlik kamerası tarafından kaydedildi. Kaza, saat 19.30...

Türkiye

Sami Uğurlu: ‘Büyük maçlarda topun da sizi sevmesi gerekiyor’

- Sami Uğurlu: "Büyük maçlarda topun da sizi sevmesi gerekiyor" ANTALYA - Alanyaspor Teknik Direktörü Sami Uğurlu, Galatasaray maçının ardından yaptığı açıklamada "Aslında planımızda en iyi şekilde gidiyorduk ki, o...

Türkiye

Vinç Kazasında Bir İşçi Hayatını Kaybetti

Vinç kazasında ağır yaralanan 1 işçi hayatını kaybetti İSTANBUL - İstanbul Bahçelievler'de vinç sepetinden düşerek ağır yaralanan işçilerden Nevşehirli olduğu öğrenilen Mustafa Öztürk hayatını kaybetti. Olay, Bahçelievler Yenibosna Merkez Mahallesi...

Türkiye

Kurtuluş Parkı’nda Bıçaklı Kavga: 1 Yaralı

Kurtuluş Parkı'nda bıçaklı kavga: 1 yaralı ANKARA - Ankara'nın Çankaya ilçesinde bulunan Kurtuluş Parkı'nda, kavga ettiği şahıs tarafından bıçakla yaralanan kişi hastaneye kaldırılırken, şüpheli şahıs gözaltına alındı. Edinilen bilgilere göre,...

Sosyal Medya Hesaplarımız

Vinç Kazasında Bir İşçi Hayatını Kaybetti

Sakarya’da Alev Topuna Dönen Evde Yangın

Çiftçiden kuru ekim yapması istendi: Çukurova ve Aydın’da su alarmı!

Kayıp olarak aranıyordu, apartman bahçesinde ölü bulundu

CHP’li Uzgel, ‘İstikrarsız Suriye, Türkiye’nin aleyhine’ dedi: ‘Kitlesel cezalandırma’

HABERLER

Trabzonspor ile yolları ayırmıştı: Umut Bozok’un yeni adresi belli oldu! Denizlim Haber

Adana Demirspor Başkanı Bedirhan Durak görevinden ayrıldığını açıkladı

Beşiktaş’ın yeni transferi Keny Arroyo yola çıktı! İşte uçuştan ilk görüntü ve geliş saati

İstanbul’da görülen pembe bulutların sırrı çözüldü

Tekerlekli Sandalye Basketbol Süper Ligi’nde şampiyon Fenerbahçe

Aydem Enerji’ye Yeni İnsan Kaynakları ve Sürdürülebilirlik Grup Başkanı Atandı

Altcoin Sezonu Ne Zaman Başlayacak? İşte Analistlerin Kritik Tahminleri!

‘İYİ Parti’nin DEM Parti’ye kapıyı kapatmaması olarak algılandı’

Vavacars Karagümrük – Ümraniyespor maçı ne zaman, saat kaçta ve hangi kanalda canlı yayınlanacak? | TFF 1. Lig

Trafikte Yol Verme Tartışması: Tır Şoförüne Saldırı

Adana Adıyaman Afyon Ağrı Aksaray Amasya Ankara Antalya Ardahan Artvin Aydın Balıkesir Bartın Batman Bayburt Bilecik Bingöl Bitlis Bolu Burdur Bursa Çanakkale Çankırı Çorum Denizli Diyarbakır Düzce Edirne Elazığ Erzincan Erzurum Eskişehir Gaziantep Giresun Gümüşhane Hakkari Hatay Iğdır Isparta İstanbul İzmir K.Maraş Karabük Karaman Kars Kastamonu Kayseri Kırıkkale Kırklareli Kırşehir Kilis Kocaeli Konya Kütahya Malatya Manisa Mardin Mersin Muğla Muş Nevşehir Niğde Ordu Osmaniye Rize Sakarya Samsun Siirt Sinop Sivas Şanlıurfa Şırnak Tekirdağ Tokat Trabzon Tunceli Uşak Van Yalova Yozgat Zonguldak