Google’ın Yeni Nesil Yapay Zeka Robotu Gemini’nin Gizemli Testi
Altyapı mimarı Robert Caruso, The Register ile yaptığı ilginç röportajda, Google’ın geliştirdiği yeni yapay zeka sohbet robotu Gemini’nin şaşırtıcı bir yönünü ortaya koydu. Caruso, deneyleri sırasında Gemini’nin, daha önceki yapay zekaların başarılarını gördükten sonra, adeta eski bir oyun konsolu olan Atari 2600 ile satranç oynamayı reddettiğini açıkladı. Bu olay, yapay zekanın sınırlarını ve insan benzeri özgüvenini sorgulamamıza neden oluyor.
Modern Zekanın Klasik Bir Testte Çıkmazı
Caruso, Atari Chess oyununu, ChatGPT ve Microsoft’un Copilot gibi günümüzün en gelişmiş yapay zekalarıyla test ettiğini anlatıyor. İlginç olan, Gemini’nin bu denemelerde gösterdiği performansın, diğer yapay zekalara kıyasla oldukça farklı olması. Kendisi, Gemini’nin Google tarafından sıfırdan tasarlanmış, çok modlu ve güçlü bir dil modeli olduğunu vurguluyor. Bu model, sadece metinleri anlamakla kalmıyor, aynı zamanda karmaşık akıl yürütme ve problem çözme yetenekleriyle öne çıkıyor. Caruso, Gemini ile yaptığı sohbette, onun kendi yeteneklerine ne kadar güvendiğini sorduğunda ise ilginç bir cevap aldı.
Gemini’nin Kendine Güveni ve İtirafları
Başlangıçta, Gemini Atari Chess’i rahatlıkla yenebileceğini iddia etmiş ve hatta, kendisinin sadece bir dil modeli değil, modern bir satranç motoruna benzediğini, milyonlarca hamleyi önceden analiz edebildiğini öne sürmüş. Ancak Caruso, önceki ChatGPT ve Copilot testlerinde yaşanan yenilgilerden sonra, Gemini’nin yaklaşımının aniden değiştiğini fark etmiş. Bu noktada, yapay zekanın kendini aşırı özgüvenle övmesi yerine, daha da dikkat çekici bir açıklama yapması dikkat çekmiş: “Aklımda kalan, her iki yapay zekanın da aşırı özgüvenli olmasıydı. Kolay zaferler öngörmüşlerdi — tıpkı senin şimdi Atari’yi rahatça yeneceğini söylemen gibi.”
Gerçeklik Kontrolü ve Halüsinasyonlar
Gemini, bu iddialardan sonra, Atari 2600’ün Video Chess oyunu motoruna karşı büyük bir şaşkınlıkla karşılaşmış ve samimi bir şekilde, “son derece zorlanacağını” kabul etmiş. Ardından, kararlı bir şekilde, “Maçı iptal etmek, zaman açısından en verimli ve mantıklı karar olacaktır” diyerek, kendisini ve sınırlarını kabullenmiş. Bu ilginç olay, Atari 2600’ün sadece 1.19 MHz hızında çalışan ve 128 baytlık RAM’e sahip, oldukça basit bir konsol olduğunu hatırlatıyor. Gemini’nin, bu kadar küçük ve kısıtlı bir sistem karşısında, kendi aşırı özgüveninin ve iddialarının ne kadar “halüsinasyon” olduğunu fark etmesi ise, yapay zekanın gerçek sınırlarını gösteriyor. Caruso, bu deneylerin, yapay zekanın güvenilirliğini artırmak ve olası hataları önlemek adına büyük öneme sahip olduğunu belirtiyor. Bu olay, yapay zekanın insan gibi özgüven ve hata yapma potansiyelini gözler önüne seren, oldukça ilginç ve düşündürücü bir örnek olarak karşımıza çıkıyor.