Google’dan OpenAI’a yanıt: Project Astra duyuruldu

Posted by

Google, bundan 6 yıl önce Duplex adından bir yapay zeka demosunu yine bir I/O geliştirici etkinliğinde göstermiş ve bir berberden randevu almıştı. Aradan geçen yılların ardından Google, kısa bir süre önce Project Astra’yı duyurdu. Paylaşılan demoda Project Astra, bir telefon kamerası aracılığıyla etrafta bulunan her şeyi görebiliyor ve bunlar hakkında sorularınıza yanıt verebiliyor.

Google’ın DeepMind CEO’su Demis Hassabis bugünkü açılış konuşmasında, ekibinin günlük yaşamda yardımcı olabilecek evrensel yapay zeka aracıları geliştirmeye çalıştıklarını ifade etti. Project Astra ise bu amaca doğru atılan bir adım.

Project Astra nedir?

Project Astra, ana arayüzü vizör olan bir uygulama gibi görünüyor. Google, Project Astra’yı gelişmiş görme ve konuşma duyarlı aracı olarak tanımlıyor ve yapay zeka asistanlarının geleceğinin bu olduğunu söylüyor.

Paylaşılan demoda telefonu elinde tutan kişinin cihazın kamerasını ve Project Astra’yı ofisin bazı kesimlerine götürüp sorular sorduğunu görüyoruz. Gösterilen örnekte kullanıcı, sesli bir şekilde “Ses çıkaran bir şey gördüğünde bana söyle” dedikten sonra Gemini ile desteklenen yapay zeka “Ses çıkaran bir hoparlör görüyorum” yanıtını veriyor. Ardından kullanıcı, yapay zekaya hoparlörde işaret ettiği şeyin ne olduğunu soruyor ve “Bu tweeter. Yüksek frekanslı sesler üretir.” yanıtını alıyor.

Google, yaptığı açıklamaya göre bu videonun tek çekimde ve gerçek zamanlı olarak yapıldığının altını çiziyor. Videonun ilerleyen kısımlarında Gemini’nin bir monitördeki kod parçalarını tanımladığı ve açıkladığı, kullanıcıya pencereden görünen manzaraya göre hangi mahallede olduğunu söylediği gösteriliyor.
En etkileyici kısım ise kullanıcının “Gözlüklerimi nerede gördüğümü hatırlıyor musun?” sorusunu sorduğunda yaşanıyor. Video içerisinde yapay zekaya gözlük hakkında bir şey sorulmadı, hatta kullanıcının o anda telefon kamerasında gösterdiği sahnede bir gözlük de bulunmuyordu. Ancak buna rağmen Gemini, “Evet, hatırlıyorum. Gözlüğün kırmızı bir elmanın yanında” diyor.
İkinci enteresan kısım ise kullanıcının gözlüğü takması ve telefonu bırakması. Kullanıcı gözlüğü taktıktan sonra video, giyilebilir cihazda göreceğiniz perspektife geçiyor. Bu bölümde tahtadaki diyagram hakkında yapay zekaya “Bu sistemi daha hızlı hale getirmek için buraya ne ekleyebilirim?” diye soruluyor. Astra ise “Sunucu ile veritabanı arasına bir önbellek eklemek hızı artırabilir” söyleminde bulunuyor.

Nasıl çalışıyor?

Bir asistanın gerçekten faydalı olabilmesi için karmaşık ve dinamik dünyayı tıpkı insanlar gibi anlaması ve tepki vermesi, bağlamı anlaması ve harekete geçmesi için gördüklerini ve duyduklarını hatırlaması gerekiyor. Ayrıca proaktif, öğretilebilir ve kişisel olması gerekiyor, böylece kullanıcılar onunla doğal bir şekilde ve gecikme veya gecikme olmadan konuşabilirler.
Google, Gemini’yi temel alarak, video karelerini sürekli kodlayarak, video ve konuşma girdisini bir olaylar zaman çizelgesinde birleştirerek ve bu bilgileri verimli bir şekilde geri çağırmak için önbelleğe alarak bilgileri daha hızlı işleyebilen prototip aracılar geliştirdiğini söylüyor. Google, önde gelen konuşma modellerini temel aldığını ancak daha geniş bir tonlama yelpazesi de sunduğunu söylüyor. Bu aracılar kullanılan bağlamı daha iyi anlayabiliyor ve konuşma sırasında hızlı bir şekilde yanıt verebiliyor.

Project Astra piyasaya ne zaman çıkacak?

Açıkçası Google, Project Astra’nın piyasaya ne zaman çıkacağı, daha doğrusu çıkıp çıkmayacağını söylemedi. Esasında adından da anlaşılacağı üzere bu bir proje ve süreç içinde öğrenilen şeyler Google hizmetlerinde yer bulacak.

Google, gelecekte bu asistanların telefonunuz veya gözlükleriniz aracılığıyla kullanılabileceğini söylerken de buna işaret ediyor. Burada “gözlük” söylemi önemli. Google Glass’ın geri dönüşüne bakıyor olabiliriz. Öte yandan DeepMind CEO’su Demis Hassabis, gösterilen bazı yeteneklerin Gemini uygulaması gibi Google ürünlerine bu yıl içinde geleceğini söyledi.

Leave a Reply

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir