OpenAI'ın yeni modeli hayal kırıklığı yaratabilir: Yapay zekada 'sınıra' ulaştık mı?

ChatGPT'nin mimarı OpenAI firmasının merakla beklenen yeni yapay zeka modeli, beklenen seviyeye ulaşamadı. "Orion" kod adıyla bilinen ve büyük bir heyecan dalgası yaratan modelin, firmanın piyasaya sürdüğü son model olan GPT-4'le hemen hemen aynı seviyede olduğu söyleniyor.

OpenAI'ın yeni modeli hayal kırıklığı yaratabilir: Yapay zekada 'sınıra' ulaştık mı?

Teknoloji haberleri sitesi The Information'ın görüştüğü kaynaklara göre, ChatGPT'nin mimarı OpenAI firmasının merakla beklenen yeni yapay zeka modeli, beklenen seviyeye ulaşamadı. "Orion" kod adıyla bilinen ve büyük bir heyecan dalgası yaratan modelin, firmanın piyasaya sürdüğü son model olan GPT-4'le hemen hemen aynı seviyede olduğu söyleniyor.

The Information'a konuşan araştırmacılara göre Orion'daki iyileştirmeler, GPT-3 ile GPT-4 arasındakinden daha az. Üstelik Orion'ın performansının, programlama gibi alanlarda önceki modellere yetişemediği, iyileştirmelerin yalnızca dil yeteneklerini kapsadığı iddia edildi. Öte yandan, modelin veri merkezlerinde çalıştırılması önceki sürümlere kıyasla daha da maliyetli olabilir.

Yapay zekanın geleceği için önemli bir mesaj olabilir

Uzmanlar, Orion'ın hayal kırıklığı yaratma olasılığının aynı zamanda yapay zekanın geleceği için de önemli mesajlar içerdiği görüşünde.

OpenAI araştırmacılarına göre iyileştirmenin beklenen düzeyde olmaması, yapay zekayı besleyecek yüksek kaliteli eğitim verilerinin yetersizliğinden kaynaklanıyor. Zira kamuoyuna açık verilerin neredeyse hepsi kullanıldı.

Şirket yapay zeka araçlarını eğitmek için metin, video, araştırma makaleleri ve romanlar dahil olmak üzere insan yapımı büyük miktarda veri topladı. Ancak bunların tedariği sınırlı.

Araştırma şirketi Epoch AI, haziran ayında, şirketlerin 2028 yılına kadar kullanılabilir metinsel verileri tüketebileceğini tahmin etmişti.

OpenAI'ın bu duruma çözüm bulmak için Nick Ryder liderliğinde bir "Temeller Ekibi" oluşturduğu öne sürülüyor.

Firmanın CEO'su Sam Altman, haziran ayında konuyla ilgili bir açıklama yapmış ve odak noktasının daha az veriden daha çok şey öğrenmeye kayacağını söylemişti.

Şirket, bu boşluğu kapatmak için yapay zeka modellerinin kendisinin ürettiği eğitim materyallerine güvenebilir. Bu materyallere "sentetik veri" adı veriliyor.

The Information, Orion'ın GPT-4'ten sentetik verilerden ve OpenAI'nin yeni "akıl yürütme" modeli olarak görülen o1'den yararlandığını yazdı. Ancak, ismini açıklamak istemeyen OpenAI araştırmacılarına göre bu yaklaşım, yeni modelin "belirli yönlerden eski modellere benzemesi" riskini taşıyor.

Bahsi geçen o1 modeli, odak noktasını eğitimden çıkarıma kaydırarak yeni ölçekleme fırsatları yaratmayı amaçlıyor.

LLM'lerin ilerlemesinde genel bir yavaşlama olabilir

ChatGPT gibi büyük dil modellerinin (LLM) ilerlemesinde yavaşlama olacağı aslında sektördeki beklentilerden biriydi. Zira bu yavaşlama OpenAI'ın da ötesine uzanıyor gibi görünüyor.

Teknoloji sitesi The Verge, yakın zamanda Google'ın beklenen dil modeli Gemini 2.0'ın hedeflerin gerisinde kaldığını bildirmişti.

Google destekli yapay zeka firması Anthropic'in amiral gemisi olan Opus'un 3.5 sürümündeki geliştirme çalışmalarının durdurulduğu da öğrenilmişti. Firmanın muhtemelen kullanıcıları ve yatırımcıları hayal kırıklığına uğratmamak için başka bir model olan Sonnet'i piyasaya sürdüğü düşünülüyor.

Yapay zeka eğitiminde sentetik veri kullanmanın riskleri

Sentetik veri yeni bir kavram değil. Kuruluşlar uzun yıllardır birçok amaç için bu tür veri kümeleri oluşturuyor. Ancak yeni LLM'lerin gelişiyle birlikte, "sentetik veri" terimi yeni bir anlam kazandı.

Bu veriler, yapay zekanın "ya şöyle olursa" senaryolarına dayanan, yaşanması olası olayları değerlendirirken daha proaktif hale gelmesini sağlamayı amaçlıyor. Bu senaryolar yapay zekaya öngörülemeyen durumlara dair yanıtları bir insandan çok daha hızlı bir şekilde otomatikleştirme yeteneği kazandırabilir.

Ancak aynı zamanda sentetik verilerle ilgili riskler de var. Bunların başında veri kalitesi geliyor. Forbes'a göre, sentetik veriler, gerçek dünya verilerinin karmaşıklığından ve nüanslarından yoksun olabilir ve bu da gerçek dünya senaryolarında iyi performans gösteremeyen yapay zeka modellerinin geliştirilmesine yol açabilir.

Medya kurumlarıyla telif sözleşmeleri

OpenAI'ı veri konusunda sıkıştıran bir diğer unsur da, internetteki içeriklerin önemli bir kısmının sahibi olan medya kurumlarının telif hakkı araması.

Nitekim nisan ayının sonunda aralarında The New York Daily News ve The Chicago Tribune'ün de yer aldığı sekiz günlük gazete, telif hakkıyla korunan makaleleri kullanmalarını engellemek için OpenAI ve onun en büyük yatırımcısı Microsoft'a dava açmıştı.

Dava dosyalarında ChatGPT'nin sorulara yanıt vermek için kullandığı milyonlarca haber ve makale için izin alınmadığı veya telif ödemesi yapılmadığı ifade edilmişti.

Suçlamalar karşısında OpenAI ise medya ortaklıkları kurmaya başlamıştı.

Anlaşma imzalanan medya kurumları arasında News Corp (The Wall Street Journal, New York Post ve The Daily Telegraph'ın yayın grubu), Axel Springer (Business Insider ve Politico), Financial Times, The Associated Press haber ajansı, The Atlantic, Vox, Le Monde ve El Pais gibi önde gelen kurumlar var.

Sınıra ulaştık mı?

The Information'a konuşan kurumsal yazılım şirketi Databricks'in kurucu ortağı ve yönetici başkanı Ion Stoica, "gerçek verilerin" sentetik verilerden daha yararlı olduğunu belirterek şöyle söyledi:

"Genel bilgi soruları için, şimdilik LLM'lerin performansında bir duraklama noktasına ulaştığımızı iddia edebiliriz."

Kaynak: Euro