İnsanlar gibi yapay zekâ modelleri de bazen “fazla düşünmekten” yani overthinking nedeniyle hata yapabiliyor. OpenAI’nin o1 modeli veya DeepSeek’in R1 modeli gibi gelişmiş dil modelleri, mantıksal akıl yürütme yetenekleri sayesinde kendi yanıtlarını sorgulayabiliyor. Ancak bu sorgulama süreci uzadıkça, modellerin performansı da düşüyor.
Foundry CEO’su Jared Quincy Davis, durumu şöyle özetliyor: “Bir öğrenci sınavda ilk soruya üç saat harcıyorsa bu aşırı düşünmektir. Aynı döngüye yapay zekâ da girebiliyor.” Davis ve Nvidia, Google, IBM, MIT, Stanford ve DataBricks gibi teknoloji devlerinden araştırmacılar, bu soruna çözüm üretmek için yeni bir açık kaynak framework olan Ember’i geliştirdi. Ember, yapay zekâ modellerinin daha dengeli çalışmasını sağlamak için tasarlandı ve gelecekte yapay zekânın nasıl işleyeceğine dair önemli ipuçları sunuyor.
Yakın zamana kadar, yapay zekâ modellerinin daha fazla düşünmesi, daha iyi sonuçlar vereceği anlamına geliyordu. Nvidia CEO’su Jensen Huang da bu yöntemi savunmuştu. Ancak Davis ve Ember ekibi, modellerin bazen fazla düşünerek verimliliğini kaybettiğine dikkat çekiyor. Ember framework’ü, modellerin bir soruya en verimli şekilde yanıt verebilmesi için farklı sürelerde ve farklı yaklaşımlarla işlem yapmasına olanak tanıyor.
Davis, kendi deneyimlerinden yola çıkarak ChatGPT-4’e aynı soruyu defalarca sorup en iyi yanıtı seçmenin performansı artırdığını söylüyor. Ember, bu yaklaşımı daha ileri taşıyarak her soruya yanıt verecek birden fazla modelin çağrıldığı ve her modelin kendi optimum düşünme süresiyle çalıştığı bileşik bir sistem sunuyor.
Gelecekte kullanıcıların model seçmesine bile gerek kalmayabilir. Sorular, Ember gibi framework’ler aracılığıyla otomatik olarak en uygun modele yönlendirilecek. Davis, bu süreci bir kimya mühendisliği sürecine benzetiyor: “Bu yeni bir bilim dalı” diyor.
Bu sistem, insan müdahalesine ihtiyaç duymadan görevleri yerine getirecek yapay zekâ ajanlarının önünü açabilir. Soruların parçalanarak farklı modeller arasında dağıtılması ve ardından en iyi yanıtların birleştirilmesi, yapay zekâ alanında yeni bir dönemin habercisi olarak görülüyor.