Yapay zeka, sudokuda rakiplerini yenmeyi başaramadı

Colorado Üniversitesi’nden bir araştırma ekibi, yapay zeka modellerinin güvenilirliğini test etmek amacıyla 6×6 formatında oluşturdukları 2.300 yeni Sudoku bulmacasını kullandı.

Yapılan testlerde, OpenAI’nin “o1” modeli en iyi performansı göstererek toplam bulmacaların yalnızca %65’ini doğru şekilde çözebildi. Diğer modellerde bu oran daha da düşük kaldı.

Yapay zeka modellerinin temel oyunlarda ve bulmacalarda başarısız olduğunu daha önce gördük. OpenAI’nin ChatGPT’si (ve diğerleri), 1979 tarihli bir Atari oyununda bilgisayar rakibi tarafından satrançta tamamen ezildi. Apple’ın yakın tarihli bir araştırma makalesi, modellerin Hanoi Kulesi gibi bulmacalarda zorlanabileceğini de ortaya koydu.

Yapay zekayı sohbet dışında çok zorlamayın

Sohbet robotları da satranç eğitimi olmadığı için kötü sonuçlar alabilir. Mantıklı hamleler bulurlar, ancak üç, dört veya beş hamle sonrasını düşünmezler. Bu, iyi satranç oynamak için gereken temel beceridir. Sohbet robotları ayrıca bazen satranç taşlarını kurallara uymayan veya onları anlamsız bir tehlikeye atan şekillerde hareket ettirme eğilimindedir.

Dolayısıyla, yapay zeka araçları, eğitimleri olmayan konularda ve şimdilik cevaplarını internette bulamayacakları detaylarda pek de başarılı sayılmazlar. Ama yakın gelecekte bunun da değişeceğine emin olabiliriz.

Related Posts

Google ile yaşlanmayı tersine çevirmek mümkün mü?

Google DeepMind’ın AlphaFold 3 modeli, biyoteknoloji dünyasında çığır açıyor. Proteinlerin karmaşık yapısını ve moleküler etkileşimlerini saniyeler içinde tahmin eden bu yapay zeka teknolojisi, ilaç keşfini hızlandırıyor ve yaşlanmayı tersine çevirme hayalini gerçeğe dönüştürme potansiyeli taşıyor. İşte detaylar!

İnsanoid robot, ayakkabı mağazasında herkesi şaşırttı!

ABD’nin New York şehrinde ilginç bir olay yaşandı! Manhattan’ın ünlü Fifth Avenue’sünde bulunan bir Hoka ayakkabı mağazasına giren insansı bir robot, alışveriş yapanları adeta büyüledi.

Elon Musk’tan Apple’a, App Store sıralamalarında manipülasyon suçlaması

Elon Musk, Apple’ın App Store sıralamalarındaki ayrımcı uygulamalarla, OpenAI lehine adaletsizlik yapıldığını iddia etti. Musk, bu durumu tekelcilik ihlali olarak nitelendirirken, yasal adımlar atılacağını belirtti.

Popüler navigasyon uygulamasından android kullanıcılarını üzen haber

Navigasyon dünyasının önde gelen uygulamalarından Waze, köklü bir değişikliğe gidiyor. Yaklaşan güncellemelerle birlikte, eski Android işletim sistemine sahip cihazlar için yeni özelliklerin ve güvenlik güncellemelerinin sunulması durdurulacak …

35 dakikada şarj oluyor, 250 bin liradan satılıyor

Çin’de 1,7 milyonuncu Wuling Hongguang Mini EV üretim hattından çıktı.

Chromebook’ların Steam hayali çok kısa sürdü

Steam oyunlarının Chromebook’lar üzerinde çalışmasını sağlayan program, birkaç ay sonra son bulacak. Bu da Chromebook sahiplerinin Steam üzerinden oyun oynama hayalinin sonu anlamına geliyor.