Meta, OpenAI'nin GPT-4o'su ile rekabet edebilecek, yeni ve çok modlu yapay zeka modeli Bukalemun'u geliştiriyor.
Google ve OpenAI arasındaki son yapay zeka mücadelesinin sonrasında Meta'nın yapay zeka araştırmacıları, kendi modelleriyle yarışa katılmaya hazırlanıyor.
Çok modlu yapay zekâ modelleri, resimler, metinler, ses kayıtları ve videolar gibi çeşitli medya biçimlerini işleyebildikleri için büyük dil modellerinin geliştirilmiş versiyonları olarak biliniyor.
Örneğin, kameranızı açıp OpenAI'nin en yeni GPT-4 AI modelinden çevrenizle ilgili bir açıklama yazmasını isteyebilirsiniz.
BUKALEMUN NE VAAT EDİYOR?
Facebook'un birincil şirketi Meta, kendi multi modeli Chameleon (Bukalemun) ile benzer bir araç piyasaya sürmeyi hedefliyor.
Chameleon isimli yeni sistem, eski bir füzyon mimarisi üzerine inşa edildi ve bu sebeple, diğer sistemlerin çoğunda mümkün olmayan şekillerde birden fazla girdiyi bir aynı anda toplayabiliyor.
Bugüne kadar bu tür modellerin pek çoğu, işlemenin ilk seviyelerinde bu tür verileri birbirinden ayrı varlıklar olarak işliyordu ve daha sonra bunları ilişkilendirmeleri aramak için topluyordu. Bu teknik geç füzyon olarak isimlendirildi.
Bu yaklaşımın işe yaradığı görüldü ancak entegrasyonla ilgili sınırlamaları var. Bunu aşmak için Meta ekibi, modellerini erken füzyon mimarisine temellendirdi.
Meta'nın Chameleon ekibine göre model, ' metni ve görüntüleri herhangi bir rastgele sırayla anlama ve oluşturma kapasitesine sahip erken füzyon belirteci tabanlı karma modeller' dizisinden oluşuyor.
Erken füzyon mimarisini kullanan yapay zeka modelleri, geç füzyon yaklaşımının sınırlamalarının ilerisine geçmeyi vaat ediyor.
Araştırmacılar, Gemini'den farklı olarak Chameleon'un uçtan uca bir model olduğunu ve bu durumun görüntü kod çözücülere olan ihtiyacı gereksiz hale getirdiğini ifade ediyor.