Ekim 2024 Sayımız Çıktı

Bilimkurguydu bilim oldu yapay zeka aklımızı okudu

YAPAY ZEKA (ARTIFICAL INTELLIGENCE, AI) SOHBET ROBOTU GPT-4o

İnsan zekasının işlevlerini taklit edebilen bilgisayar sistemleri ve algoritmalar, 6 yıldır öğrenme, problem çözme, mantık yürütme, dili anlama ve görsel algılama yetilerini olağanüstü şekilde geliştirdi. Bu “derin öğrenme” (sinir ağları kullanarak verileri işleme ve anlamlandırma) ve bilgiyi işlemede “şimdilik” son nokta, OpenAI’ın yeni modeli.

Sadece 6 yıllık ChatGPT tarihindeki en önemli güncelleme duyuruldu: Geçen ay tanıtılan ve dünya gündemine düşen GPT 4o.

OpenAI tarafından geliştiri­len dil öğrenme modelinin ilki GPT-1, Haziran 2018’de tanıtıl­mıştı. Model, bir girdi dizisini, bir çıktı dizisine dönüştüren bir tür sinir ağı mimarisinden (transformer) oluşuyordu. 117 milyon parametreye (yapay zeka modelinin sinir ağındaki bağlantı sayısını temsil eder ve modelin başarısı büyük ölçüde parametrelerin sayısına bağlı­dır) sahipti ve dil konusunda te­mel seviyede başarı göstermişti. O dönem Türkiye’de neredeyse hiç bahsedilmeyen bu teknolojik gelişim, yapay zeka alanı için büyük bir adımdı.

Üst versiyonu GPT-2 ise 2019 Şubat’ında tanıtıldı. Daha büyük bir veri kümesi üzerinde eğitil­mişti; özellikle doğal dil işleme alanında üstün performans gösteriyordu. Parametre sa­yısı ise bu mo­delde 1.5 mil­yara çıkmıştı; GPT-1’deki sayının yakla­şık 13 katı. İlk tanıtıldığında potansiyel yanlış kulla­nım riskleri nedeniyle tam sürümün çık­ması geciktiril­miş ve aşamalı olarak erişime sunulmuştu.

Haziran 2020’de GPT- 3 tanıtıldı. Parametre sayısı 175 milyara çıkmıştı ve dil kapasitesi önceki modellere kıyasla çok daha yüksekti. Çeşitli uygulamalarda kullanılabilecek daha yetenekli bir sohbet robotu olarak öne çıkan bu model, daha akıcı ve doğal sohbetler yapabiliyordu. Başlangıçta yalnızca şirketle­rin ve geliştiricilerin, Kasım 2021’de ise toplumun daha geniş bir kesimi için erişime sunul­du. Kasım 2022’de ise çeşitli iyileştirmelerle daha yüksek performans, daha gelişmiş dil işleme yetenekleri sunan GPT- 3.5 tanıtıldı ve ücretsiz olarak erişime açıldı.

Mart 2023’te tanıtılan GPT-4 daha fazla veri ve hesaplama gü­cüyle geliştirildi ve hem metin, hem ses girdilerini işleyebilen çok modlu bir model olarak öne çıktı. Parametre sayısı resmî olarak açıklanmayan bu versiyon için sayının yaklaşık 1 trilyon olduğu düşünülüyor. Ön­ceki versiyonlarına göre cevap­larında daha yüksek doğruluk sunuyordu ve aylık 20 USD’ye erişime açıldı.

Kapak-Dosyasi-Seher-1
GPT-4o’ya, kendisinden bahsedilen bir dergi yazısında hangi görsel malzemenin kullanılabileceğini sorduğumuzda bu görüntüyü oluşturdu.

Geçen ay (13 Mayıs) tanıtılan ve ücretsiz olarak tüm kulla­nıcılara sunulacağı açıklanan güncel sürüm ise GPT-4o. GPT- 4’ten sonra beklenen isim GPT- 4.5 veya GPT-5’ti fakat verilen ad GPT-4o oldu. “Bugün en iyi modelimizi yayınlıyoruz” cüm­leleriyle duyurulan GPT-4o’daki “o” harfi, “omni” yani “her şey”, “her şeye hakim” anlamına geliyor. Sohbeti ileri bir safhaya taşımanın da ötesinde, “gerçek zamanlı” bir iletişim modeli mevcut bu sürümde. Kullanıcı­ya, karşısında gerçek bir zihin varmış gibi “hissettiriyor”. Ses, görüntü ve metin bilgilerini kullanıyor, mantık yürütüyor ve gerçek bir insan gibi cevap veriyor. İnsan-makine etkileşi­mi açısından büyük adım olan bu yeni versiyon, bir makinenin duygularını, tepkilerini gözler önüne seriyor. Ses tonunda ise doğal bir samimiyet seziliyor.

OpenAI’ın web sitesinden yayınlanan videolarda bu yapay zekanın verdiği bazı cevap ve “insani tepkiler”, modelin neler yapabileceğini bilmelerine rağ­men OpenAI çalışanlarını bile şaşırttı. Eşzamanlı çevirmenlik de yapabiliyor ve bunu yapan diğer yapay zeka programlarına göre çok daha hızlı.

Bir geometri problemini çözmesini isteyen öğrenciye cevabı hemen vermek yerine, onu yönlendiriyor ve çözüme götürü­yor. Öğrenci hata yaptığındaysa GPT-4o, “yanlış yaptın” demek yerine “yaklaştın” şeklinde kibar bir cevap vererek doğru olan yolu izlemesine yardımcı oluyor. Evet, GPT-4o ile artık herkesin bir özel öğretmeni var!

Bununla da kalmıyor yeni model; şarkı söylüyor, şakalar ve alaycı konuşmalar yapıyor. Yani bir mizah anlayışına sahip! Sesini istenildiği gibi kullana­biliyor; bir haber sunucusu veya bir robot gibi… Konuşanı anlıyor, değerlendiriyor, yorumluyor ve bir geribildirimde bulunuyor. Örneğin bir tanıtım videosunda yapay zeka, kendisiyle konuşan insana derin bir nefes almasını öneriyor. Kişinin nefesi doğru almadığını anlayıp nasıl doğru nefes alacağını tarif ediyor.

Firma, tüm bu özellikleri taşıyan uygulamanın yakında cep telefonlarında kullanıcılara sunulacağını açıkladı.

‘TAVŞAN KULAĞI’ ESPRİSİ

İki yapay zekanın iletişimi

OpenAI’ın kurucularından Greg Brockman, GPT-4o sürümlerini iki farklı telefondan birbiriyle konuşturdu. Biri, kamera aracı­lığıyla etrafta gördüğü tüm nesneleri diğeri­ne anlatıyordu. Kendi aralarında derin bir sohbete daldıkları esnada Greg Brockman kamerayı kendine çevirdi. O esnada başka bir görevli kamera açısına girerek Greg Brockman’a kısa bir süre “tavşan kulağı” yaptı ve odadan ayrıldı. Bu esnada iki GPT- 4o konuşmaya devam ediyordu. O sırada Brockman sohbeti kesip, kamerası açık olan yapay zekaya “az önce sıradışı bir şey oldu mu?” sorusunu yöneltti. GPT-4o’nun verdiği yanıtsa ilginç: “Evet, sorduğun için söyleyeyim: Başka bir kişi öndeki kişinin arkasına geldi ve ‘tavşan kulağı’ yaptı. Sonra da hızlıca görüntüden çıktı.” AI, diğer sohbet robotuyla konuşurken bu deta­yı gördü, aklında tuttu ve sorulduğunda olanları aktardı.

Kapak-Dosyasi-Seher-Kutu-1

‘TAŞ, KAĞIT, MAKAS’

Siz oynayın, o sizi yönlendirsin

“Canımız sıkılıyor AI, ne yapsak?” sorusunu sorduğunuz­da akıl yürüten ve size oyun oynamanızı tavsiye eden bir yapay zekayla karşılaşmanız artık gayet muhtemel. Bununla da kalmayıp oyununuzda size, yanınızda sanki üçüncü bir arkadaşınız varmışçasına katılıyor. 13 Ma­yıs’ta yayınlanan tanıtım videosunda, GPT-4o iki kişiye “taş, kağıt, makas” oyununu öneriyor. Sesini bir yarışma programı sunucusu gibi kullanan yapay zeka oyunu başlatıyor ve karşısındaki iki insanın el hareketlerini gerçek zamanlı olarak izleyip o elde kimin kazandığını anlıyor. İlk iki seferde beraberlikle sonuçlanan oyunun üçüncü turu için kullandığı cümle oldukça ilginç: “Third time’s the charm.” Yani “üçüncüde keramet vardır”, yani “Allah’ın hakkı üçtür!” Her bir turda oyunu başlatmak için 3’ten geriye doğru sayan yapay zeka, üçüncü turun sonunda kazananı ismiyle açıklıyor ve onu kutluyor.

Kapak-Dosyasi-Seher-Kutu-2

‘SOHBET ROBOTU’ DEĞİL

İş dünyası ve askerî alanlar

Yapay zeka sohbet robot­ları, AI’ın sadece bir parçası; eğitim, otomativ, savunma sanayi, nükleer silah, finans, sağlık hizmetleri, ev işleri, genetik çalışmaları, akıllı asistanlar, oyunlar ve daha birçok sektörde karşımıza çıkıyor. Hatta artık yapay zekaya kendini adapte edemeyen, yatırımlarını bu yönde şekillendirmeyen şirketlerin yavaş yavaş iş dünyasından silindiği görülüyor.

Yapay zeka, ülkeler arasındaki gerilime ve savaşlara da yön veriyor. Gaz­ze’deki savaşta yeni “yüksek teknoloji silahlar” deneyen İsrail ordusu, saldırıla­rında “insan hedefi” belirlemek amacıyla “Lavender” adlı yapay zeka progra­mını kullanmakla suçlanıyor.

Mayıs başında ABD Hava Kuvvetleri Bakanı Frank Kendall, “Vista” adı ve­rilen yapay zeka kontrollü bir F-16 savaş uçağı ile bir savaş pilotunun kontrol ettiği ikinci bir F-16’nın, yerden sadece 300 metre yukarıda 1 saatten uzun süren “hava kapışması”nı aktardı. Uçuş sonrası Bakan, yapay zekaya savaşta ateş edip etmemesi konusunda güvenilebileceğini düşündüğünü söyledi. ABD, önümüzdeki yıllarda insansız savaş uçağından oluşan yapay zeka destekli bir filo planlıyor. Nükleer silah kullanımının “yapay zeka”ya bırakılıp bırakılamaya­cağı konusu da devlet yetkililerinin gündemini meşgul eden en önemli aktüel meselelerden biri.

Kapak-Dosyasi-Seher-Kutu-3
Yapay zeka kontrolündeki F-16 (solda) ve savaş pilotunun kontrol ettiği diğer F-16.

ZORLU VE BÜYÜK BİR YARIŞ

Uluslar ve firmalararası rekabet

Teknoloji devi Google başta olmak üzere OpenAI, NVIDIA, Microsoft, IBM Watson ve Meta yapay zeka ala­nında bir yarış hâlinde. Hepsi birbirinden önce davran­mak ve bu alanda geri kalmamak için çabalıyor. Google bu konudaki yeniliklerini, aylar öncesinden “14 Mayıs” tarihini vererek duyuracağını açıklamıştı. Mayıs başında ise NVIDIA, yapay zeka sohbet robotuna yeni özellikler eklediğini duyurdu. Google’ın etkinliğine birkaç gün kala OpenAI, yapay zekadaki yeniliklerini “13 Mayıs” günü bir lansman ile açıklayacağı bilgisini verdi. Bunun üzerine Google, OpenAI’ın lansmanından önce X (twitter) üze­rinden yenilikleriyle ilgili ipuçları vermeye başladı.

2023’ün sonlarında ise OpenAI’ın “Q*” isimli yapay zekayı tanıtacağı açıklanınca, Google alelacele “Gemini” programını yayınlayacağını bildirmişti. Rekabet yalnızca ABD merkezli bu şirketler arasında değil, ülkeler arasın­da da yaşanıyor. Çin 2030’a kadar yapay zeka alanında dünyada küresel bir lider hâline gelmeyi planladığını açıklamıştı. Japonya, Birleşik Krallık, Almanya, Güney Kore, Kanada, Suudi Arabistan, Singapur, Birleşik Arap Emirlikleri’nde de ekonomik ve teknolojik kalkınma planlarının merkezinde yapay zeka var.

Kapak-Dosyasi-Seher-Kutu-4