Genel
2024 yılını yapay zeka ile ilgili en büyük tartışmayla kapattık

Yapay zekada 2024’ü nasıl kapattık?
Şimdiye kadarki en büyük tartışmayla!
OpenAI, “Yapay Genel Zeka’ya (Artificial General Intelligence-AGI) ulaştık” dedi. Böylece yapay zekada bol tartışmalı ve belirsiz bir döneme girmiş olduk.
Zira, Mevcut yapay zeka teknikleriyle AGI’ya ulaşılamayacağını düşünen Google yazılımcılarından Francois Chollet ve yapay zekanın önde gelen isimlerinden Gary Marcus başta olmak üzere pek çok isim şu cevabı verdi: “Mümkün değil”.
Tamam, son 3 ayı özetleyelim…
Sevgili dostlar, söz konusu AGI olunca, bundan 5 yıl önce teknoloji dünyasının önde gelen isimlerinden çoğu aynı tanımı yapabilirdi: İnsan seviyesinde anlayabilme ve işleri insan gibi yerine getirebilme…
Peki, insan seviyesinde anlayabilme ne demekti?
- ✔️İnsan gibi çevresinden, deneyimlerinden “otomatikman” öğrenme ve çözüm getirme
- ✔️Mantık ve akıl yürütme: nedenselliği anlayabilme, tümevarım yapabilme
- ✔️Bunu yaparken işlevsel olması gereken pek çok alanda öğrenerek duruma adapte olabilme
- ✔️Bilinç ve öz farkındalık geliştirebilme.
Makinenin işleri yerine getirebilmedeki başarısı en son, “insanların yapabileceği işlerin en az yüzde 70’i” olarak ölçümlendirilmişti.
Derken derken, geldiğimiz noktada OpenAI Eylül 2024’te “nedensellik yeteceğine” sahip olduğunu belirttiği ChatGPT’nin o1 versiyonunu çıkardı.
OpenAI CEO’su Sam Altman, “ChatGPT o1 Full Version, en karmaşık ve zor sorunları artık akıl yürüterek ve mantıklı bir şekilde cevaplıyor” dedi. Ve bu versiyonun öncelikli olarak nedensellik gerektiren çok karmaşık araştırma, inceleme yapan biliminsanları ve araştırmacılara açacağını söyledi.
o1 Full Version’daki temel değişiklik, “Zincirleme Düşünce (Chain of Thought Reasoning) esasına göre metin ve görseller arasında multimdel hesaplama yapması. Ve en zorlu sorunlara (özellikle kodlama ve matematiksel) bu esasa göre cevap vermesi” olarak açıklandı. o1 Full Version’ın lansmanında modelin 4’e göre yüzde 34 daha az hata yapıp yüzde 50 daha hızlandığı söylendi ve canlı olarak da test edildi.
Ve 20 Aralık’ta o1’in bir üst modeli olan o3 açıklandı. (İngiliz telekomünikasyon şirketinin adı Q2. O nedenle o2’yi es geçmişler.)
o3 ile birlikte yapay zekayla ilgili en büyük tartışmaya başlıyoruuuuuz.
Çünkü…
OpenAI bu kez o3’ün karmaşık matematik, ileri düzey bilim soruları ve kodlama gibi alanlarda o1’den üç kat daha iyi performans gösterdiğini söylüyor. Diyor ki; “ARC-AGI gibi yapay zekaların mantıksal çıkarım yeteneklerini test eden bir benchmark’ta da üstün başarı sağlıyor.”
Bu şu demek: “Biz AGI’ya ulaştık.”
Ancak yukarıda dediğim gibi ARC-AGI kavramını ortaya atan Francois Chollet, Gary Marcus, Meta’nın Yapay Zeka Direktörü Yann LeCun, Google… karşı çıkıyor.
ARC-AGI ne? Francis Chollet kim?

Chollet, bana göre Turing Test’e Kahve Testi (2017) ile yeni nesil bir yorum katan Apple’ın kurucularından Steve Wozniak’ın JR’ı. Wozniak’tan farklı olarak Yapay Genel Zeka’ya işlevsellik değil de, LLM’ler temelinde bir yorum getiriyor.
Wozniak’ın Kahve Testi bir bilgisayar ekranını değil, bir robota gereksinim duyuyor. Robot, daha önce hiç görmediği rastgele bir evde mutfağı bulup bir kahve demlemek zorunda. Bunu otonom robotların yapabileceklerini görmek bakımından bir benchmark olarak kabul ediyor.

Turing Testi, yapay zeka için bir test olarak kabul edilirken; Kahve Testi, AGI için bir test olarak kabul ediliyor.
Chollet ise Google yazılım mühendisi olmasının yanısıra, derin öğrenme uygulama programlama arayüzü Keras’ın yaratıcısı. Yapay zekada geldiğimiz noktanın, yani büyük dil modellerine (LLM) her geçen gün daha fazla veri ve hesaplama kaynağı sağlayarak daha gelişmiş yapay zekalar yaratma hedefinin AGI’ye ulaşmak için mümkün olmayacağını savunuyor.
Chollet’in kendi argümanının bir süredir yapay zeka ortamında tartışılmasına istinaden, Haziran 2024’te Mike Knoop, Lab42 ve Infinite Monkey ile birlikte $1.1 milyonluk ARC Prize (ARC Ödülü) isimli bir yarışma başlattı. Araştırmacılardan, mevcut yapay zeka sistemler için zorlayıcı fakat insanlar için oldukça basit olan mekansal akıl yürütme problemlerini çözmelerini istiyor.
Yarışmanın sonuçları Chollet’in haklı olduğunu gösteriyor ki, en üstün LLM’ler 2020’deki yüzde 21 doğruluk oranından yüzde 43 doğruluk oranına ilerlemiş olsa da hala insan ortalaması olan yüzde 85 altında kalıyor. Veya 20 Aralık’a kadar kalıyordu.
OpenAI ise o3 modeli, ARC-AGI Yarı-Özel Değerlendirme setinde (Bu veri seti 2019’dan beri GitHub’da herkese açık olarak bulunuyor. Hatta açık olması tıp ve bilimde çok ciddi fayda potansiyelini barındırırken, kötüye kullanılabileceği de dile getiriliyor) yüzde 87,5 puan alarak AGI’ye ulaştığını ileri sürüyor.

OpenAI’ya göre, o3 doktora düzeyindeki “Google’a karşı dayanıklı” bilim sorularında yüzde 87,7 başarı oranına ulaşabiliyor. (Bir uzman bir doktora sahibinin başarı oranıysa 70). GPT modellerinin ARC-AGI’de düşük puanlar aldığı göz önüne alındığında, o3’ün yüzde 75-88 aralığındaki performansı önemli bir sıçrama olarak görülüyor.
Francis Chollet’in bu iddiayla ilgili yorumunu da aktarayım: “ARC-AGI’yi geçmek, AGI’ye ulaşmakla eşdeğer değildir ve aslında, o3’ün henüz AGI olmadığını düşünüyorum. o3, hala çok kolay bazı görevlerde başarısız oluyor, bu da insan zekasıyla temel farklar olduğunu gösteriyor.
Ayrıca, ilk veriler, yaklaşan ARC-AGI-2 ölçütünün o3 için hala önemli bir zorluk oluşturacağını ve yüksek hesaplama gücüyle bile o3’ün 2 ölçütüdeki skorunun yüzde 30’un altına düşebileceğini gösteriyor. (Oysa eğitim almamış bir akıllı insan hala yüzde 95’in üzerinde bir puan alabilir).”
HuggingFace’in kurucu ortağı Thom Wolf ise şu değerlendirmeyi yapmış: : “İnsanların, eğitim seti üzerinde eğitim yapmanın normal olduğunu yorumlaması ilginç ama bir şekilde, AGI seviyesinde yeteneklere yaklaştıkça, modelin herhangi bir özel alt görevde gerçekten ince ayar yapmaya (fine-tune) ya da özel olarak eğitilmeye gerek duymayacağımızı beklerdim/umut ederdim.”
NYU’nun ünlü kognitif bilimci ve yapay zeka eleştirmeni akademisyeni Gary Marcus… O da baştan ChatGPT’nin yolunun yol olmadığını söyleyip duruyor.

Şöyle diyor:
* O3’ün, insanlara daha yakın bir şekilde, ön eğitim olmadan (pre-training) ne yaptığını gerçekten test edebilmiş değiliz.
*Yanlış deney yapıldığı ve önemli veriler verilmediği için, insanlarla doğrudan karşılaştırma yapamıyoruz.
*Dışarıdan ciddi bir bilimsel inceleme yapılana kadar (şu ana kadar hiç yapılmadı), o3’ün ne kadar ileri olduğu ya da ne kadar önemli olduğu konusunda gerçekten bir şey bilemeyeceğiz.
*Gördüğümüz şey AGI değil. Hem Chollet hem de OpenAI’den (teknik ekipten) Anup (Krishnamraju) bunu açıkladı. Ancak sadece canlı video sonrası…”
Uzunca yazdım.
Çünkü 2025’te AGI “sorunu” ile ilgili olarak pek çok iddia, yaklaşım, bakış açıları duyacağız.
Birincisi; OpenAI, OpenAI + Microsoft ilişkisi ve diğer cephe yani Google Gemini, Meta Llama, X, Hugging Face, Antrophic, Amazon Olympus vb. LLM’ler arasındaki rekabet nedeniyle…
İkincisi: Microsoft Haziran 2023’te OpenAI ile olan uzun vadeli ortaklığını yeni bir “uzun yıllara yayılacak milyar dolarlık yatırım” ile uzattığını duyurmuştu. Bu anlaşma için, “Microsoft’un, OpenAI’nin araştırmalarına yardımcı olmak için süper bilgisayar sistemlerinin geliştirilmesi ve dağıtımına yönelik yatırımlarını artırmasını sağlayacak. Anlaşmanın kilit noktası ise, Microsoft’un OpenAI için tek ve özel bulut ortağı olması. Microsoft’un bulut hizmetleri, OpenAI’nin tüm ürünler, API hizmetleri ve araştırmalarındaki iş yüklerini güçlendirecek” denilmişti.

Şimdiyse OpenAI’ın AGI hamlesiyle şu yorumlar yapılıyor: AGI “tanımlandığında”, bu, yaklaşık 100 milyar dolarlık bir kar anlamına gelecek. OpenAI, AGI’ye ulaştığını söylerse, bu Microsoft ile olan bulut anlaşmasını sonlandırma hakkını da doğuruyor. Çünkü bu noktada AGI’nin çok büyük bir pazar oluşturması bekleniyor. Bu da OpenAI için bağımsız bir karlılık potansiyeli anlamına geliyor.
Özetle: AGI’ye ulaşmak, OpenAI için Microsoft ile olan anlaşmayı sonlandırarak bağımsız bir başarı elde etmek anlamına gelebilir.
Tüüüüüüm bunları söyledikten sonra, benim bunları okuduğum tüm kaynakların bir şekilde, bir nedenden taraflı olduğunu söylemem lazım. Zira bu, insanlar şu anda farkında olmasa da dünyanın en zor, en çatışmalı savaşı.
Sadece biz bunu “sanal ortamda” göremiyoruz!