İnsan zekasının işlevlerini taklit edebilen bilgisayar sistemleri ve algoritmalar, 6 yıldır öğrenme, problem çözme, mantık yürütme, dili anlama ve görsel algılama yetilerini olağanüstü şekilde geliştirdi. Bu “derin öğrenme” (sinir ağları kullanarak verileri işleme ve anlamlandırma) ve bilgiyi işlemede “şimdilik” son nokta, OpenAI’ın yeni modeli.
Sadece 6 yıllık ChatGPT tarihindeki en önemli güncelleme duyuruldu: Geçen ay tanıtılan ve dünya gündemine düşen GPT 4o.
OpenAI tarafından geliştirilen dil öğrenme modelinin ilki GPT-1, Haziran 2018’de tanıtılmıştı. Model, bir girdi dizisini, bir çıktı dizisine dönüştüren bir tür sinir ağı mimarisinden (transformer) oluşuyordu. 117 milyon parametreye (yapay zeka modelinin sinir ağındaki bağlantı sayısını temsil eder ve modelin başarısı büyük ölçüde parametrelerin sayısına bağlıdır) sahipti ve dil konusunda temel seviyede başarı göstermişti. O dönem Türkiye’de neredeyse hiç bahsedilmeyen bu teknolojik gelişim, yapay zeka alanı için büyük bir adımdı.
Üst versiyonu GPT-2 ise 2019 Şubat’ında tanıtıldı. Daha büyük bir veri kümesi üzerinde eğitilmişti; özellikle doğal dil işleme alanında üstün performans gösteriyordu. Parametre sayısı ise bu modelde 1.5 milyara çıkmıştı; GPT-1’deki sayının yaklaşık 13 katı. İlk tanıtıldığında potansiyel yanlış kullanım riskleri nedeniyle tam sürümün çıkması geciktirilmiş ve aşamalı olarak erişime sunulmuştu.
Haziran 2020’de GPT- 3 tanıtıldı. Parametre sayısı 175 milyara çıkmıştı ve dil kapasitesi önceki modellere kıyasla çok daha yüksekti. Çeşitli uygulamalarda kullanılabilecek daha yetenekli bir sohbet robotu olarak öne çıkan bu model, daha akıcı ve doğal sohbetler yapabiliyordu. Başlangıçta yalnızca şirketlerin ve geliştiricilerin, Kasım 2021’de ise toplumun daha geniş bir kesimi için erişime sunuldu. Kasım 2022’de ise çeşitli iyileştirmelerle daha yüksek performans, daha gelişmiş dil işleme yetenekleri sunan GPT- 3.5 tanıtıldı ve ücretsiz olarak erişime açıldı.
Mart 2023’te tanıtılan GPT-4 daha fazla veri ve hesaplama gücüyle geliştirildi ve hem metin, hem ses girdilerini işleyebilen çok modlu bir model olarak öne çıktı. Parametre sayısı resmî olarak açıklanmayan bu versiyon için sayının yaklaşık 1 trilyon olduğu düşünülüyor. Önceki versiyonlarına göre cevaplarında daha yüksek doğruluk sunuyordu ve aylık 20 USD’ye erişime açıldı.
Geçen ay (13 Mayıs) tanıtılan ve ücretsiz olarak tüm kullanıcılara sunulacağı açıklanan güncel sürüm ise GPT-4o. GPT- 4’ten sonra beklenen isim GPT- 4.5 veya GPT-5’ti fakat verilen ad GPT-4o oldu. “Bugün en iyi modelimizi yayınlıyoruz” cümleleriyle duyurulan GPT-4o’daki “o” harfi, “omni” yani “her şey”, “her şeye hakim” anlamına geliyor. Sohbeti ileri bir safhaya taşımanın da ötesinde, “gerçek zamanlı” bir iletişim modeli mevcut bu sürümde. Kullanıcıya, karşısında gerçek bir zihin varmış gibi “hissettiriyor”. Ses, görüntü ve metin bilgilerini kullanıyor, mantık yürütüyor ve gerçek bir insan gibi cevap veriyor. İnsan-makine etkileşimi açısından büyük adım olan bu yeni versiyon, bir makinenin duygularını, tepkilerini gözler önüne seriyor. Ses tonunda ise doğal bir samimiyet seziliyor.
OpenAI’ın web sitesinden yayınlanan videolarda bu yapay zekanın verdiği bazı cevap ve “insani tepkiler”, modelin neler yapabileceğini bilmelerine rağmen OpenAI çalışanlarını bile şaşırttı. Eşzamanlı çevirmenlik de yapabiliyor ve bunu yapan diğer yapay zeka programlarına göre çok daha hızlı.
Bir geometri problemini çözmesini isteyen öğrenciye cevabı hemen vermek yerine, onu yönlendiriyor ve çözüme götürüyor. Öğrenci hata yaptığındaysa GPT-4o, “yanlış yaptın” demek yerine “yaklaştın” şeklinde kibar bir cevap vererek doğru olan yolu izlemesine yardımcı oluyor. Evet, GPT-4o ile artık herkesin bir özel öğretmeni var!
Bununla da kalmıyor yeni model; şarkı söylüyor, şakalar ve alaycı konuşmalar yapıyor. Yani bir mizah anlayışına sahip! Sesini istenildiği gibi kullanabiliyor; bir haber sunucusu veya bir robot gibi… Konuşanı anlıyor, değerlendiriyor, yorumluyor ve bir geribildirimde bulunuyor. Örneğin bir tanıtım videosunda yapay zeka, kendisiyle konuşan insana derin bir nefes almasını öneriyor. Kişinin nefesi doğru almadığını anlayıp nasıl doğru nefes alacağını tarif ediyor.
Firma, tüm bu özellikleri taşıyan uygulamanın yakında cep telefonlarında kullanıcılara sunulacağını açıkladı.
‘TAVŞAN KULAĞI’ ESPRİSİ
İki yapay zekanın iletişimi
OpenAI’ın kurucularından Greg Brockman, GPT-4o sürümlerini iki farklı telefondan birbiriyle konuşturdu. Biri, kamera aracılığıyla etrafta gördüğü tüm nesneleri diğerine anlatıyordu. Kendi aralarında derin bir sohbete daldıkları esnada Greg Brockman kamerayı kendine çevirdi. O esnada başka bir görevli kamera açısına girerek Greg Brockman’a kısa bir süre “tavşan kulağı” yaptı ve odadan ayrıldı. Bu esnada iki GPT- 4o konuşmaya devam ediyordu. O sırada Brockman sohbeti kesip, kamerası açık olan yapay zekaya “az önce sıradışı bir şey oldu mu?” sorusunu yöneltti. GPT-4o’nun verdiği yanıtsa ilginç: “Evet, sorduğun için söyleyeyim: Başka bir kişi öndeki kişinin arkasına geldi ve ‘tavşan kulağı’ yaptı. Sonra da hızlıca görüntüden çıktı.” AI, diğer sohbet robotuyla konuşurken bu detayı gördü, aklında tuttu ve sorulduğunda olanları aktardı.
‘TAŞ, KAĞIT, MAKAS’
Siz oynayın, o sizi yönlendirsin
“Canımız sıkılıyor AI, ne yapsak?” sorusunu sorduğunuzda akıl yürüten ve size oyun oynamanızı tavsiye eden bir yapay zekayla karşılaşmanız artık gayet muhtemel. Bununla da kalmayıp oyununuzda size, yanınızda sanki üçüncü bir arkadaşınız varmışçasına katılıyor. 13 Mayıs’ta yayınlanan tanıtım videosunda, GPT-4o iki kişiye “taş, kağıt, makas” oyununu öneriyor. Sesini bir yarışma programı sunucusu gibi kullanan yapay zeka oyunu başlatıyor ve karşısındaki iki insanın el hareketlerini gerçek zamanlı olarak izleyip o elde kimin kazandığını anlıyor. İlk iki seferde beraberlikle sonuçlanan oyunun üçüncü turu için kullandığı cümle oldukça ilginç: “Third time’s the charm.” Yani “üçüncüde keramet vardır”, yani “Allah’ın hakkı üçtür!” Her bir turda oyunu başlatmak için 3’ten geriye doğru sayan yapay zeka, üçüncü turun sonunda kazananı ismiyle açıklıyor ve onu kutluyor.
‘SOHBET ROBOTU’ DEĞİL
İş dünyası ve askerî alanlar
Yapay zeka sohbet robotları, AI’ın sadece bir parçası; eğitim, otomativ, savunma sanayi, nükleer silah, finans, sağlık hizmetleri, ev işleri, genetik çalışmaları, akıllı asistanlar, oyunlar ve daha birçok sektörde karşımıza çıkıyor. Hatta artık yapay zekaya kendini adapte edemeyen, yatırımlarını bu yönde şekillendirmeyen şirketlerin yavaş yavaş iş dünyasından silindiği görülüyor.
Yapay zeka, ülkeler arasındaki gerilime ve savaşlara da yön veriyor. Gazze’deki savaşta yeni “yüksek teknoloji silahlar” deneyen İsrail ordusu, saldırılarında “insan hedefi” belirlemek amacıyla “Lavender” adlı yapay zeka programını kullanmakla suçlanıyor.
Mayıs başında ABD Hava Kuvvetleri Bakanı Frank Kendall, “Vista” adı verilen yapay zeka kontrollü bir F-16 savaş uçağı ile bir savaş pilotunun kontrol ettiği ikinci bir F-16’nın, yerden sadece 300 metre yukarıda 1 saatten uzun süren “hava kapışması”nı aktardı. Uçuş sonrası Bakan, yapay zekaya savaşta ateş edip etmemesi konusunda güvenilebileceğini düşündüğünü söyledi. ABD, önümüzdeki yıllarda insansız savaş uçağından oluşan yapay zeka destekli bir filo planlıyor. Nükleer silah kullanımının “yapay zeka”ya bırakılıp bırakılamayacağı konusu da devlet yetkililerinin gündemini meşgul eden en önemli aktüel meselelerden biri.
ZORLU VE BÜYÜK BİR YARIŞ
Uluslar ve firmalararası rekabet
Teknoloji devi Google başta olmak üzere OpenAI, NVIDIA, Microsoft, IBM Watson ve Meta yapay zeka alanında bir yarış hâlinde. Hepsi birbirinden önce davranmak ve bu alanda geri kalmamak için çabalıyor. Google bu konudaki yeniliklerini, aylar öncesinden “14 Mayıs” tarihini vererek duyuracağını açıklamıştı. Mayıs başında ise NVIDIA, yapay zeka sohbet robotuna yeni özellikler eklediğini duyurdu. Google’ın etkinliğine birkaç gün kala OpenAI, yapay zekadaki yeniliklerini “13 Mayıs” günü bir lansman ile açıklayacağı bilgisini verdi. Bunun üzerine Google, OpenAI’ın lansmanından önce X (twitter) üzerinden yenilikleriyle ilgili ipuçları vermeye başladı.
2023’ün sonlarında ise OpenAI’ın “Q*” isimli yapay zekayı tanıtacağı açıklanınca, Google alelacele “Gemini” programını yayınlayacağını bildirmişti. Rekabet yalnızca ABD merkezli bu şirketler arasında değil, ülkeler arasında da yaşanıyor. Çin 2030’a kadar yapay zeka alanında dünyada küresel bir lider hâline gelmeyi planladığını açıklamıştı. Japonya, Birleşik Krallık, Almanya, Güney Kore, Kanada, Suudi Arabistan, Singapur, Birleşik Arap Emirlikleri’nde de ekonomik ve teknolojik kalkınma planlarının merkezinde yapay zeka var.