Teknoloji Kampüsü

  1. Anasayfa
  2. »
  3. Haberler
  4. »
  5. OpenAI, videoları gerçek zamanlı olarak analiz yapan GPT-4o’yu tanıttı

OpenAI, videoları gerçek zamanlı olarak analiz yapan GPT-4o’yu tanıttı

Serhat Sarımlı Serhat Sarımlı - - 4 dk okuma süresi
162 0
OpenAI

OpenAI, videoları gerçek zamanlı olarak analiz eden üretken bir yapay zeka modeli olan GPT-4o’yu tanıttı. ChatGPT’yi hayata geçiren sistemin evrimi artık metin, görüntü ve sesi anlamak için daha fazla yetenekle çalışıyor.

Platformun en büyük yeni özelliklerinden biri de videoları gerçek zamanlı olarak analiz edebilmesi. Başka bir deyişle, bir kullanıcı örneğin cep telefonu kamerasını açıp bir matematik problemi gösterebilir ve böylece yapay zeka matematiğin doğru yapılıp yapılmadığını kontrol edebilecek.

Bu etkileşimde, kişi cep telefonunun selfie kamerasını açıp chatbot’a giydiği kıyafetler hakkında sorular bile sorabilir. Başka bir örnekte, ChatGPT’nin bir jokenpô maçının hakemi olabilmesi için selfie kamerasını açmak da mümkün olacak. Aşağıdaki videoya göz atın:

GPT-4o ayrıca sesli etkileşim formatında da iyileştirmelere de sahip oldu. Bu sayede araç ChatGPT’yi Amazon’un Alexa’sının bir tür evrimine dönüştürecek.

İnsana çok benzeyen bir etkileşimle, yeni dil modeli, gerçek bir sohbette bir insanın tepkisine çok benzer şekilde 232 milisaniyeye kadar yanıtlar vaat ediyor. Bu, üretken yapay zekanın konuşabilen, şarkı söyleyebilen, hikayeler anlatabilen, açıklama yapabilen ve daha fazlasını yapabilen sanal bir asistan gibi çalışmasını sağlıyor.

İlginizi çekebilir; Galaxy S21 FE İçin One UI 6.1 Güncellemesi Başladı

Tüm bunlar farklı ses tonlarıyla yapılacaktır. Başka bir deyişle, kullanıcı ChatGPT’den bir şeyi daha melankolik, neşeli, kızgın bir sesle, daha robotik bir tarzda vb. açıklamasını bile isteyebilir.

OpenAI’ye göre, GPT-4o’daki “o” harfi “omni” anlamına geliyor, çünkü ses, video, metin ve görüntüleri karıştırıyor. Buradaki fikir tam olarak ChatGPT’nin temel platformunun her şeyi bir araya getirdiğini vurgulamaktır.

Sunumda OpenAI, GPT-4o’nun kitap formatında veya daktiloda yazılmış metinleri de görüntüleyebildiğini açıkladı. Bu durumda, kullanıcı bir metin isteyebilir ve ChatGPT geleneksel formatta değil, özel bir görüntünün içine yazılmış metinle geri dönecektir.

Buna ek olarak, teknoloji görüntü analizinde iyileştirmeler vaat ediyor. Başka bir deyişle, kullanıcılar fotoğraf yükleyebilecek ve her bir görüntünün ayrıntıları yapay zeka tarafından analiz edilecek.

GPT-4o tarafından desteklenen bir başka özellik de gerçek zamanlı çeviri olacak. Bu gibi durumlarda iki kişi bir araya gelebilir ve yapay zeka sistemi her ikisinin de birbirini anlayabilmesi için konuşmalarını tercüme edebilir.

GPT-4o’nun metin ve görüntü özellikleri bugün ChatGPT’de kullanıma sunuldu, ancak yalnızca Plus kullanıcıları için geçerli olacak. GPT-4o ile Ses Modunun yeni bir sürümü önümüzdeki haftalarda ChatGPT Plus’a alfa olarak gelecek.

Geliştiricilere gelince, GPT-4o yakında bir metin ve görüntü modeli olarak API formatında gelecek. OpenAI’ye göre GPT-4o, GPT-4 Turbo’ya kıyasla iki kat daha hızlı, yarı fiyatına ve daha yüksek hız limitlerine sahip.

What’s your Reaction?
0
0
0
0

İlgili Yazılar

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir