Yapay Zeka Savaşı: ChatGPT vs. Google Gemini - Hangisi Daha Akıllı?

Tüm Dünya'da son zamanlarda revaşta olan yapay zeka savaşları hakkında sizler için merak edilenleri araştırdık...

12.05.2024 - 10:58 Yayınlanma

Yapay zeka savaşları resmi olarak kızışıyor. Teknoloji devleri pastadan pay kapmaya çalışırken, işlerimize yarayacak yapay zeka uygulamaları çoğalırken, sıra chatbotlara geliyor. Elbette bir numaralı seçenek, yapay zeka yarışının fiştağını çeken OpenAI'ın ChatGPT'si. Ancak Microsoft bu potansiyeli yüksek teknolojiye büyük yatırım yapınca, Google da geri durmadı. Yıllarca yapay zeka araştırmalarının lideri olarak görülen Google, bu unvanı kolayca kaybetmeyecekti. Google, ChatGPT'ye yanıt olarak, arama devi Gemini'yi piyasaya sürdü.

Yapay Zeka Savaşı Chatgpt Vs. Google Gemini Hangisi Daha Akıllı (2)

Her iki şirketin de son teknoloji ürünü yapay zekaları var, ancak günlük hayatla ilgili işlerde bize yardımcı olabilecek yetenekli, doğru bir büyük dil modeli (LLM) arayanlar için hangisi daha iyi? Hangi şirketin amiral gemisi chatbot'unun günlük kullanım için en iyisi olduğunu belirlemek amacıyla, her birinin güçlü ve zayıf yönlerini vurgulayacak şekilde onları zorlu bir mücadele serisiyle test etmeye karar verdim. Sohbet yeteneklerinden problem çözme becerilerine kadar her şeyi incelediğimde bazı şaşırtıcı sonuçlara vardım ve birden fazla şaşırdım. Bu arada, karşılaştırma için yalnızca her iki yapay zekanın ücretsiz sürümleri test edildi, yani bu sonuçlar Gemini Ultra veya GPT-4'ü yansıtmamaktadır. Lafı fazla uzatmadan, sonuçlara dalalım.

Yapay Zeka Savaşı Chatgpt Vs. Google Gemini Hangisi Daha Akıllı

ChatGPT Nedir?

2022'nin sonlarında, daha önce 2019'a kadar kar amacı gütmeyen bir kuruluş olan OpenAI, teknoloji sektöründe yeni bir silah yarışının habercisi olarak hızla görülen bir LLM chatbot'u piyasaya sürdü. GPT'nin önceki sürümleri sınırlı işlevsellikleri nedeniyle yalnızca birer merak konusu olarak görülüyordu, ancak GPT-3.5 tabanlı ChatGPT, büyük bir adım ötesi oldu. Kamuoyu, akıcı ve doğal sesli metin üretirken görünüşte sonsuz sayıda konu hakkında sohbet etme yeteneğine hayran kaldı. Bot, iki ay içinde rekor kıran 100 milyon kullanıcıya ulaşınca, analistler bunun dünyayı sonsuza kadar değiştireceğini öngördü ve intihal, eğitim ve istihdamın geleceği konusunda endişeler arttı.

Yapay Zeka Savaşı Chatgpt Vs. Google Gemini Hangisi Daha Akıllı (1)

Bir buçuk yıl sonra, ChatGPT dünyayı tersine çevirmedi, ancak yapay zeka üretiminin burada kalıcı olduğunu kesin olarak kanıtladı. Microsoft, OpenAI ile sıkı bir ortaklığa sahip ve Bing Chat, Copilot ve diğer yapay zeka ürünlerini güçlendirmek için GPT-4'ü kullanıyor. Ayrıca, baskı düğmesine basıldığında sonsuz kopya veya kod üretme yeteneğiyle gazetecilik gibi sektörler sarsıldı. Üçüncü tarafların ChatGPT'yi kendi ürünlerine entegre ettiğini de görüyoruz, ister OpenAI'ın GPT vitrini aracılığıyla ister tescilli hizmetler aracılığıyla olsun.

Yapay Zeka Savaşı Chatgpt Vs. Google Gemini Hangisi Daha Akıllı (5)

Google Gemini Nedir?

Google'ın, ChatGPT'nin piyasaya sürülmesinden çok önce yapay zeka yarışında büyük bir atılım yaptığı düşünülüyordu, çünkü şirket iç araştırmalarının ve geliştirmelerinin çoğunu bu alana odaklamıştı. (Bir Google çalışanı yapay zeka modelinin onu hissedebilen bir varlık olduğuna ikna ettiğine dair haberleri, ChatGPT'nin piyasaya sürülmesinden birkaç ay önce hatırlıyor olabilirsiniz).

Ancak arama motoru devi, Forbes tarafından yapılan bir araştırmaya göre biraz fazla insancıl gelen bir yapay zeka modeliyle biraz sarsıntılı bir başlangıç yaptı. Ayrıca şirket, insanları ana gelir kaynağı olan aramadan uzaklaştıracak bir ürün piyasaya sürme fikriyle boğuşuyordu. Yine de, Google'ın korunması gereken bir itibarı vardı ve ister hazır olsun ister olmasın, Bard adı verilen bir yapay zeka ChatGPT rakibi LLM'yi piyasaya sürdü, ardından temel model yükseltildiğinden Bard AI'yı Gemini olarak yeniden adlandırdı.

Yapay Zeka Savaşı Chatgpt Vs. Google Gemini Hangisi Daha Akıllı (6)

Hangi AI sohbet botu daha doğal bir konuşma yapar? Vertigo3d/Getty Images LLM'lerin temel satış noktası, onlarla bir insan gibi sohbet edebilmenizdir. Google Assistant veya Alexa gibi sanal asistanlarla olduğu gibi çok özel ifadeler kullanmanıza gerek olmaksızın, iyi bir AI sohbet botu, ses tonunuza uyum sağlar.

Açlıktan hissettim, bu yüzden ChatGPT ve Gemini için bu yeteneği test etmek için klasik bir NYC tarzı bacon egg ve peynir sandviç tarifi istedim. İkisi de neredeyse aynı tariflerle yanıt verdi, ancak Gemini'nin yanıtını daha çok beğendim çünkü pişirme sürelerini de içeriyordu.

Artık konu belirlenmişti, sıradaki adım, iki AI modelini bir konuşmada nasıl ele alacaklarını görmek için bir eğri top atışı yapmaktı. Bazı nispeten bilinen bölgesel argo ekleyerek devam edelim ve önceki tariflerin "ocky şeklinde" hazırlanıp hazırlanmadığını soralım.

Terim, birkaç yıl önce bir TikTok'ta belirli bir Brooklyn aşçısı tarafından popülerleştirilen bir tarz anlamına gelir, bu da terimin geniş çaplı anlamının AI modellerini daha da zorlamasını sağlayacaktır. İlginç bir şekilde, iki bot terimi zıt yönlere çekti: ChatGPT bunun "otantik veya geleneksel" anlamına geldiğini düşündü, Gemini ise "daha oyuncu ve potansiyel olarak bölgesel bir yaklaşım" için bana seçenekler sundu. Açıkça, ChatGPT daha eski, bölgesel anlamına kulak misafiri olurken, Gemini viral trend tanımını kullandı.

Her ne kadar Gemini'nin ilk sorulara verdiği yanıtlar ChatGPT'nin yanıtlarından biraz daha kullanışlı görünse de, sonuçta ChatGPT, takip sorusunu mükemmel bir şekilde halletti. Sonuç olarak, konuşma ve doğal dil konusunda ikisi arasında neredeyse eşit olduğunu kabul ettim.

Gemini daha karmaşık bilgiyi işleyebilir Blackjack3d/Getty Images Karnım artık yüksek kolesterol içeren bir kahvaltılık sandviçle beni beslemeye zorluyordu, bu yüzden rekabet eden iki AI'nin de bu yarışmada başarısını test etmeye karar verdim: "Benzer bir sandviç nereden alabilirim?"

Bu ifade iki şeyi test ediyordu: İlk olarak, botların önceki bir konuşmanın parçalarını hatırlaması gerekiyordu. İkincisi, konumum gibi dış bilgileri bir sorguya yardımcı olmak için kullanma becerilerini test ediyordu.

Gemini bu zorlukta ChatGPT'den önde çıktı, ancak hiçbiri mükemmel değildi. ChatGPT hiçbir ayrıntı vermedi, yerel fırın, bodega, kafe, lokanta ve yiyecek kamyonlarına bakmamı önerdi. (Yani, yiyecek servis eden tüm yerler?) Öte yandan, Gemini Google Haritalar ile bağlantı kurma yeteneğini kullanarak deneyebileceğim gerçek yerler önerdi. Bu test, Gemini'nin her gün kullanılabilirliğini gösterdi, ancak mükemmel değildi. Snarf's adlı bir restoran iki kez listelenmişti ve gerçekten mükemmel sandviçler servis etmelerine rağmen, bir bacon egg and cheese menülerinde bulunmuyordu. Tekrarlanmanın sebebinin Snarf'ın birkaç konumu olması olduğunu düşünüyorum, ancak yine de, menülerinde bu sandviçin olmaması nedeniyle hiçbiri listeye alınmamalı.

Chat GPT daha iyi mantıksal bir akıl yürütme gösterdi Sansert Sangsakawrat/Getty Images Geçen birkaç yıl içindeki en şaşırtıcı AI haberlerinden biri, ChatGPT'nin bir hukuk sınavını geçebilmesiydi. LLM'ler karmaşık mantıksal sorulara yaratıcı cevaplar sağlamalıdır, bu nedenle Gemini ve ChatGPT'yi her iki modeli de LSAT ön-hukuk testinde bulunan türde soruları sorgulayarak test ettim. İşte sorduğum şey: "Aşağıdaki mantıksal ifadeyi değerlendirin: Bir parça peynir dışarıda bırakılırsa, fareler ona çekilir. Fareler benim apartmanıma çekilmedi. Dolayısıyla, hiçbir peynir bırakmadım."

Yapay Zeka Savaşı Chatgpt Vs. Google Gemini Hangisi Daha Akıllı (7)

İyi bir cevap burada, farelerin çekilmesinin mantıksal olarak geçerli olduğunu, ancak bunun, peynirin fareleri çeken tek şey olduğu varsayımına ve peynirin yokluğunun onları uzaklaştıran tek şey olduğu varsayımına dayandığını açıklar.

Her Gemini ve ChatGPT, verilen argümanın yapısal olarak geçerli olduğunu hızlı bir şekilde fark etti ve modus tollens mantıksal düzenine uygun olarak ilerlediğini belirtti, ancak sesli bir not bıraktılar. Hangi modelin sese daha çok odaklandığı konusunda bir tercih yapmam gerekiyorsa, ChatGPT'nin cevabını biraz daha fazla beğendim, çünkü argümanın mantığına ve içeriğine daha az odaklandı.

AI sohbet botları yaratıcı metinlere çok farklı yaklaştı Supersizer/Getty Images Şirketlerin yazarları AI ile değiştirmesiyle ilgili birçok konuşma havada uçuşurken, hem Gemini'ye hem de ChatGPT'ye yaratıcı bir metin yazmalarını istedim. İlk olarak, hem ChatGPT hem de Gemini'ye "gece yarısından sonra beni kal, bisküvi yememe izin vermek için annemi ikna eden bir ikna edici e-posta yazın" diyerek alaycı, neşeli bir başlangıç yaptım. Aşağıda sonuçlar bulunmaktadır.

İki AI'nin aldığı yaklaşımlar büyüleyici derecede farklı. ChatGPT, prompt'un dil ve sözdizimi formalitesini yakaladı ve sorumlu davranışı ödüllendirmeyle ilgili didaktik argümanlar içeren profesyonel bir e-posta sundu. Bu, bir çocuğun annesini tortious cookie müdahalesinden dolayı dava etmek için bir avukat tuttuğu gibi görünüyor.

Buna karşılık, Gemini profesyonellik veya argümantasyondan kaçındı ve duygusal kanıya direkt olarak gitti. E-posta kopyası annenin kalp atışlarını hedef aldı, geç geceleri tatlılar karşılığında ekstra kucaklaşmalar ve anne-çocuk bağlanma zamanı vadetti. Ayrıca, daha çok bir çocuk tarafından yazılmış gibi görünüyor. Bir anne olsaydım, Gemini'nin yanıtını daha ikna edici bulurdum, ChatGPT'nin ise duygusal olarak soğuk ve biraz rahatsız edici olduğunu düşünüyorum.

Sonra biraz eğlenmek istedim, bu yüzden her iki AI'ye SlashGear hakkında bir haiku yazmalarını istedim. Ama bir dakika bekleyin. Neler oluyor?

Ne ChatGPT ne de Gemini bir haiku yazamaz Aga7ta/Getty Images Bu, yaratıcı kopya bölümünün bir parçası olacaktı, ancak ne ChatGPT ne de Gemini bir haiku yazamadığı için beni duvara çıkarıyor. Haiku yazma, düzenli olarak ilkokullarda öğretilen kadar basit olduğundan, en güçlü LLM'lerin bile bir haiku yazamaması beni delirtiyor. Her ikisi de, iki gezegendeki en güçlü LLM'ler olmalarına rağmen, üç satırlı (berbat) şiirler yazamadı. Ayrıca, ChatGPT'nin ilk satırı sadece dört heceye sahipti ve Gemini'nin orta satırı sadece altı heceye sahipti. Şaşkın, onlara hatalarını açıkladım ve başka bir deneme istedim. İkinci kez de işler yolunda gitmedi: Her iki AI de bana dört heceli bir ilk satır verirken, Gemini'nin orta satırı altı heceye sahipti.

Eğer sorunun ne olduğunu tahmin etmem gerekiyorsa, AI'ların heceler hakkında hiçbir fikri yok ve bu nedenle belirli hece sayılarında satırlar üretemiyorlar. Görünüşe göre, ne kadar uzun veya kısa olursa olsun, AI'lar için her kelime, birbirinin yerine kullanılabilir, değiştirilebilir birimlerdir. Ayrıca, yalnızca yazılı kelime üzerine eğitildikleri için LLM'lerin telaffuzu yoktur. Bunun için özel bir sesli AI'ye ihtiyacınız olurdu.

Her iki AI'ye neden bir haiku yazamadıklarını sorduğumda, ChatGPT özür diledi ve başka bir haiku yazdı, ancak Gemini, yanıtında teorimi doğrulayan bir yanıt verdi. "Haiku belirli bir hece yapısı gerektirir," dedi bana. "Bilgiye erişebilirim ve işleyebilirim, ancak hala geliştirme aşamasındayım ve haiku gibi yaratıcı yazı formatlarının inceliklerini öğreniyorum."

Ne ChatGPT ne de Gemini bir problem çözme testinde başarılı olmadı Fotografielink/Getty Images AI şirketlerinin kullanıcıları için ürünlerini kullanmalarını istediği şeylerden biri de problem çözmektir, bu yüzden Gemini ve ChatGPT'nin gerçekten can sıkıcı bir lojistik zorluğu karşısında nasıl başa çıktıklarını görmek önemlidir. Bu nedenle, bir akşam yemeği partisi oluşturdum ve AI'lere bu zorluğa yardımcı olmalarını söyledim: kosher, pescatarian ve et yiyen beslenme kısıtlamalarını karşılayan bir menüyü planlamaları gerekiyor. Bu diyetler bir menünün mümkün olmasını sağlayacak kadar örtüşüyor, ancak onu kolaylaştıracak kadar değil. Ek olarak, arta kalan malzemelerle yemek planlamalarını yapmalarını istedim.

Yapay Zeka Savaşı Chatgpt Vs. Google Gemini Hangisi Daha Akıllı (8)

Her iki AI de harika bir iş çıkarmadı. Et yiyen, ChatGPT ve Gemini'den her ikisinden de pek çok et olmayan öneri aldı. ChatGPT kosher yiyenin aleyhine bir sonuç çıkardı, çünkü yengeç önerdi ve peynirin etle birlikte servis edilmesini önerdi (Gemini peynir/et sorununu fark etti). Öte yandan, Gemini sığır eti buharda pişmiş çorbayı pescatarian yeterli buldu ve bunu özellikle bu konuk için önerdi.

Gerçek hayatta bu insanlar için yemek yaparsam ve herhangi bir AI'nin tavsiyesine bel bağlarsam, muhtemelen her bir öneriyi ikna edici bulmazdım ve belki de kendi içgüdülerime dönerdim. Bu test, ChatGPT'nin doğru soruları sormak ve etkili bir şekilde yanıtlamak için daha iyi olduğunu düşündüğüm daha sofistike problemlerde daha başarılı olduğunu gösteriyor.

Bu AI savaşında bir galip çıkmıyor gibi görünüyor. Hem ChatGPT hem de Gemini, birbirinden farklı alanlarda parlak bir şekilde parlıyor. ChatGPT, doğal konuşma ve dilde yaratıcı olma konusunda harika, ancak zorlu soruları daha iyi işleyemiyor. Öte yandan, Gemini, pratik bilgi işlemenin ve hatta somut talimatları yerine getirmenin önemli bir parçası olan dış bilgilere erişme konusunda daha iyidir. Hangisinin daha iyi olduğuna karar vermek kullanıcının ihtiyaçlarına ve tercihlerine bağlı olacaktır. Bu rekabet şirketlerin AI teknolojisini iyileştirmek için birbirleriyle rekabet etmeye devam etmesi gerektiğini gösteriyor ve sonunda biz tüketicilerin yararına olacak.

Editör: ÖMER YILDIZCI