Genel

2024 yılını yapay zeka ile ilgili en büyük tartışmayla kapattık

Yapay zekada 2024’ü nasıl kapattık?

Şimdiye kadarki en büyük tartışmayla! 

OpenAI, “Yapay Genel Zeka’ya (Artificial General Intelligence-AGI) ulaştık” dedi. Böylece yapay zekada bol tartışmalı ve belirsiz bir döneme girmiş olduk.

Zira, Mevcut yapay zeka teknikleriyle AGI’ya ulaşılamayacağını düşünen Google yazılımcılarından Francois Chollet ve yapay zekanın önde gelen isimlerinden Gary Marcus başta olmak üzere pek çok isim şu cevabı verdi: “Mümkün değil”.

Tamam, son 3 ayı özetleyelim…

Sevgili dostlar, söz konusu AGI olunca, bundan 5 yıl önce teknoloji dünyasının önde gelen isimlerinden çoğu aynı tanımı yapabilirdi: İnsan seviyesinde anlayabilme ve işleri insan gibi yerine getirebilme… 

Peki, insan seviyesinde anlayabilme ne demekti?

  • ✔️İnsan gibi çevresinden, deneyimlerinden “otomatikman” öğrenme ve çözüm getirme
  • ✔️Mantık ve akıl yürütme: nedenselliği anlayabilme, tümevarım yapabilme
  • ✔️Bunu yaparken işlevsel olması gereken pek çok alanda öğrenerek duruma adapte olabilme
  • ✔️Bilinç ve öz farkındalık geliştirebilme.

Makinenin işleri yerine getirebilmedeki başarısı en son, “insanların yapabileceği işlerin en az yüzde 70’i” olarak ölçümlendirilmişti.

Derken derken, geldiğimiz noktada OpenAI Eylül 2024’te “nedensellik yeteceğine” sahip olduğunu belirttiği ChatGPT’nin o1 versiyonunu çıkardı.

OpenAI CEO’su Sam Altman, “ChatGPT o1 Full Version, en karmaşık ve zor sorunları artık akıl yürüterek ve mantıklı bir şekilde cevaplıyor” dedi. Ve bu versiyonun öncelikli olarak nedensellik gerektiren çok karmaşık araştırma, inceleme yapan biliminsanları ve araştırmacılara açacağını söyledi.

o1 Full Version’daki temel değişiklik, “Zincirleme Düşünce (Chain of Thought Reasoning) esasına göre metin ve görseller arasında multimdel hesaplama yapması. Ve en zorlu sorunlara (özellikle kodlama ve matematiksel) bu esasa göre cevap vermesi” olarak açıklandı. o1 Full Version’ın lansmanında modelin 4’e göre yüzde 34 daha az hata yapıp yüzde 50 daha hızlandığı söylendi ve canlı olarak da test edildi.

Ve 20 Aralık’ta o1’in bir üst modeli olan o3 açıklandı. (İngiliz telekomünikasyon şirketinin adı Q2. O nedenle o2’yi es geçmişler.)

o3 ile birlikte yapay zekayla ilgili en büyük tartışmaya başlıyoruuuuuz.

Çünkü…

OpenAI bu kez o3’ün karmaşık matematik, ileri düzey bilim soruları ve kodlama gibi alanlarda o1’den üç kat daha iyi performans gösterdiğini söylüyor.  Diyor ki; “ARC-AGI gibi yapay zekaların mantıksal çıkarım yeteneklerini test eden bir benchmark’ta da üstün başarı sağlıyor.”

Bu şu demek: “Biz AGI’ya ulaştık.”

Ancak yukarıda dediğim gibi ARC-AGI kavramını ortaya atan Francois Chollet, Gary Marcus, Meta’nın Yapay Zeka Direktörü Yann LeCun, Google… karşı çıkıyor.

ARC-AGI ne? Francis Chollet kim?

Francois Chollet

Chollet, bana göre Turing Test’e Kahve Testi (2017) ile yeni nesil bir yorum katan Apple’ın kurucularından Steve Wozniak’ın JR’ı. Wozniak’tan farklı olarak Yapay Genel Zeka’ya işlevsellik değil de, LLM’ler temelinde bir yorum getiriyor.

Wozniak’ın Kahve Testi bir bilgisayar ekranını değil, bir robota gereksinim duyuyor. Robot, daha önce hiç görmediği rastgele bir evde mutfağı bulup bir kahve demlemek zorunda. Bunu otonom robotların yapabileceklerini görmek bakımından bir benchmark olarak kabul ediyor.

Steve Wozniak’ın Turing Test’ine alternatif geliştirdiği Kahve Testi

Turing Testi, yapay zeka için bir test olarak kabul edilirken; Kahve Testi, AGI için bir test olarak kabul ediliyor.

Chollet ise Google yazılım mühendisi olmasının yanısıra, derin öğrenme uygulama programlama arayüzü Keras’ın yaratıcısı. Yapay zekada geldiğimiz noktanın, yani büyük dil modellerine (LLM) her geçen gün daha fazla veri ve hesaplama kaynağı sağlayarak daha gelişmiş yapay zekalar yaratma hedefinin AGI’ye ulaşmak için mümkün olmayacağını savunuyor.

Chollet’in kendi argümanının bir süredir yapay zeka ortamında tartışılmasına istinaden, Haziran 2024’te Mike Knoop, Lab42 ve Infinite Monkey ile birlikte $1.1 milyonluk ARC Prize (ARC Ödülü) isimli bir yarışma başlattı. Araştırmacılardan, mevcut yapay zeka sistemler için zorlayıcı fakat insanlar için oldukça basit olan mekansal akıl yürütme problemlerini çözmelerini istiyor. 

Yarışmanın sonuçları Chollet’in haklı olduğunu gösteriyor ki, en üstün LLM’ler 2020’deki yüzde 21 doğruluk oranından yüzde 43 doğruluk oranına ilerlemiş olsa da hala insan ortalaması olan yüzde 85 altında kalıyor. Veya 20 Aralık’a kadar kalıyordu.

OpenAI ise o3 modeli, ARC-AGI Yarı-Özel Değerlendirme setinde (Bu veri seti 2019’dan beri GitHub’da herkese açık olarak bulunuyor. Hatta açık olması tıp ve bilimde çok ciddi fayda potansiyelini barındırırken, kötüye kullanılabileceği de dile getiriliyor) yüzde 87,5 puan alarak AGI’ye ulaştığını ileri sürüyor. 

OpenAI CEO’su Sam Altman (sağda) ChatGPT o3’ü tanıtıyor.

OpenAI’ya göre, o3 doktora düzeyindeki “Google’a karşı dayanıklı” bilim sorularında yüzde 87,7 başarı oranına ulaşabiliyor. (Bir uzman bir doktora sahibinin başarı oranıysa 70). GPT modellerinin ARC-AGI’de düşük puanlar aldığı göz önüne alındığında, o3’ün yüzde 75-88 aralığındaki performansı önemli bir sıçrama olarak görülüyor. 

Francis Chollet’in bu iddiayla ilgili yorumunu da aktarayım: “ARC-AGI’yi geçmek, AGI’ye ulaşmakla eşdeğer değildir ve aslında, o3’ün henüz AGI olmadığını düşünüyorum. o3, hala çok kolay bazı görevlerde başarısız oluyor, bu da insan zekasıyla temel farklar olduğunu gösteriyor.

Ayrıca, ilk veriler, yaklaşan ARC-AGI-2 ölçütünün o3 için hala önemli bir zorluk oluşturacağını ve yüksek hesaplama gücüyle bile o3’ün 2 ölçütüdeki skorunun yüzde 30’un altına düşebileceğini gösteriyor. (Oysa eğitim almamış bir akıllı insan hala yüzde 95’in üzerinde bir puan alabilir).”

HuggingFace’in kurucu ortağı Thom Wolf ise şu değerlendirmeyi yapmış: : “İnsanların, eğitim seti üzerinde eğitim yapmanın normal olduğunu yorumlaması ilginç ama bir şekilde, AGI seviyesinde yeteneklere yaklaştıkça, modelin herhangi bir özel alt görevde gerçekten ince ayar yapmaya (fine-tune) ya da özel olarak eğitilmeye gerek duymayacağımızı beklerdim/umut ederdim.”

NYU’nun ünlü kognitif bilimci ve yapay zeka eleştirmeni akademisyeni Gary Marcus… O da baştan ChatGPT’nin yolunun yol olmadığını söyleyip duruyor.

Gary Marcus

Şöyle diyor: 

* O3’ün, insanlara daha yakın bir şekilde, ön eğitim olmadan (pre-training) ne yaptığını gerçekten test edebilmiş değiliz.

*Yanlış deney yapıldığı ve önemli veriler verilmediği için, insanlarla doğrudan karşılaştırma yapamıyoruz.

*Dışarıdan ciddi bir bilimsel inceleme yapılana kadar (şu ana kadar hiç yapılmadı), o3’ün ne kadar ileri olduğu ya da ne kadar önemli olduğu konusunda gerçekten bir şey bilemeyeceğiz.

*Gördüğümüz şey AGI değil. Hem Chollet hem de OpenAI’den (teknik ekipten) Anup (Krishnamraju) bunu açıkladı. Ancak sadece canlı video sonrası…”

Uzunca yazdım.

Çünkü 2025’te AGI “sorunu” ile ilgili olarak pek çok iddia, yaklaşım, bakış açıları duyacağız.

Birincisi; OpenAI,  OpenAI + Microsoft ilişkisi ve diğer cephe yani Google Gemini, Meta Llama, X, Hugging Face, Antrophic, Amazon Olympus vb. LLM’ler arasındaki rekabet nedeniyle…

İkincisi: Microsoft Haziran 2023’te OpenAI ile olan uzun vadeli ortaklığını yeni bir “uzun yıllara yayılacak milyar dolarlık yatırım” ile uzattığını duyurmuştu. Bu anlaşma için, “Microsoft’un, OpenAI’nin araştırmalarına yardımcı olmak için süper bilgisayar sistemlerinin geliştirilmesi ve dağıtımına yönelik yatırımlarını artırmasını sağlayacak. Anlaşmanın kilit noktası ise, Microsoft’un OpenAI için tek ve özel bulut ortağı olması. Microsoft’un bulut hizmetleri, OpenAI’nin tüm ürünler, API hizmetleri ve araştırmalarındaki iş yüklerini güçlendirecek” denilmişti.

OpenAI CEO Sam Altman (Solda) ve Microsoft CEO Satya Nadella

Şimdiyse OpenAI’ın AGI hamlesiyle şu yorumlar yapılıyor: AGI “tanımlandığında”, bu, yaklaşık 100 milyar dolarlık bir kar anlamına gelecek. OpenAI, AGI’ye ulaştığını söylerse, bu Microsoft ile olan bulut anlaşmasını sonlandırma hakkını da doğuruyor. Çünkü bu noktada AGI’nin çok büyük bir pazar oluşturması bekleniyor. Bu da OpenAI için bağımsız bir karlılık potansiyeli anlamına geliyor.

Özetle: AGI’ye ulaşmak, OpenAI için Microsoft ile olan anlaşmayı sonlandırarak bağımsız bir başarı elde etmek anlamına gelebilir.

Tüüüüüüm bunları söyledikten sonra, benim bunları okuduğum tüm kaynakların bir şekilde, bir nedenden taraflı olduğunu söylemem lazım. Zira bu, insanlar şu anda farkında olmasa da dünyanın en zor, en çatışmalı savaşı.

Sadece biz bunu “sanal ortamda” göremiyoruz!

Tags
Show More

suleguner

Yapay zeka ve robotik konularında uzman, İstanbul merkezli gazeteciyim. Sadece bu iki alanda yazan tek Türk gazeteci-yazarım. Aralarında Türkiye’nin en çok satan ekonomi dergisi ve bir İngilizce gazetenin de bulunduğu Türk medyasına ait yayınlara yazıyorum. Türkiye'nin kamuoyuna açık ilk yapay zeka ve robotik anketini 2018'de gerçekleştirerek, insanların bu iki kavrama nasıl baktığını inceledim. Detaylarını site de bulabileceğiniz "beyaz yakalı ve lisans-yüksek lisans üstü öğrencilerden" oluşan iki grupla yaptığımız anket sonuçlarında öne çıkan iki veriyi aktarmam gerekirse, yapay zeka öğrencileri çalışanlardan daha çok korkuyor. Beyaz yakalılar ise robotlardan gençlere göre daha az korkuyor. Türkiye genelinde yapılan ankete göre yapay zekanın hayatımıza giderek daha çok dahil olması veya robotların iş ve özel hayatımızda yer almaya başlaması genel anlamda bizi endişelendirmiyor. Ankete katılımcıların "İnsan zekası mı, yapay zeka mı?" sorusuna cevabıysa, "insan zekası" şeklinde olmuş. Kamuoyu araştırmalarıma her yıl devam ederek Türk halkının teknolojiyle olan ilişkisinin nabzını ölçmeyi amaçlıyorum. Teknolojiden korkulmaması gerektiğini, insanın yararına ve doğru bir şekilde kullanıldığında hayata önemli katkılarda bulunduğuna inanıyorum. Ayrıca teknolojiyle birlikte değişen hayatı iyi anlamamız gerektiğini, hayatımızdaki değişiklikleri iyi analiz etmemiz gerektiğini düşünüyorum. Bir gazeteci-yazar olarak teknolojinin insan hayatı için çizdiği vizyonu anlatmaya, konuşmalarımda insanları yakında nasıl bir dünyanın beklediğine ilişkin bir resim çizmeye çalışıyorum. Gazetecilik kariyerimde yönümü teknolojiye çevirmeden önce bazı Türk basın yayın kuruluşlarının yanısıra, ANSA İtalyan Haber Ajansı'nın Türkiye muhabirliği görevlerinde bulundum. Kariyerim boyunca pek çok ülkeyi gezerek sosyal ve teknoloji içerikli yazılar yazdım. Bu ülkeler içinde aklıma en çok yer eden Ekvador, Küba, Sudan ve Güney Kore oldu. İngilizcenin dışında İtalyancayı profesyonel iş yaşamımda kullanabiliyorum. Fitness ile ilgileniyorum ve bir sağlıklı yaşam bloğum var. Aynı zamanda amatör bir DJ’im.

Benzer İçerikler

Close
Close