ChatGPT’nin ses özelliği gerçekten sevdiğim konuşma asistanıdır


Yıllardır sesli asistanları kullanıyorum ve bana yardımcı olsalar da, cümlemin ortasında sözümü kestiklerinde veya söylediklerimi tamamen kaçırdıklarında her zaman sinirleniyorum. ChatGPT’nin ses modunu incelediğimde pek iyimser değildim ve yanıldığıma da pek sevinmedim. Ses modu yalnızca bir sohbet robotuyla konuşmaktan ibaret değil, gerçek bir sohbet hissi veriyor.

Duraklamaları, mırıldanılan düşünceleri ve hatta “uhhh” gibi dolgu kelimelerini akışı bozmadan yakalayın. Araba sürerken, yemek pişirirken ya da birden fazla görevi yerine getirmeye çalışırken, telefonu açmadan doğal bir şekilde konuşabiliyor ve faydalı yanıtlar alabiliyorum. Yazmaktan daha hızlı değil: daha kolay, daha sezgisel ve daha verimli hissettiriyor. Henüz denemediyseniz ChatGPT’nin ses modunun neden yapay zekayı kullanmanın en sevdiğiniz yolu haline gelebileceğini burada bulabilirsiniz.

kaçırmayın: ChatGPT nedir? Yapay zeka sohbet robotları hakkında bilmeniz gereken her şey

ChatGPT, OpenAI’nin tek eller serbest sohbet robotu değil. Google’ın Gemini Live’ı da aynı “benimle konuşun, ben de sizi gelişmelerden haberdar edeceğim” havasını sunuyor. Anthropic’in Claude mobil uygulaması, siz konuşurken ekrandaki kısa görüntülerle tamamlanan ses modunun beta sürümüne sahiptir ve Perplexity’nin iOS ve Android asistanları ayrıca sözlü soruları yanıtlar ve komut üzerine OpenTable veya Uber gibi uygulamaları başlatır.


Tarafsız teknoloji içeriğimizi ve laboratuvar tabanlı incelemelerimizi kaçırmayın. CNET’i ekle Google’ın tercih ettiği bir yazı tipi olarak.


Ancak herkes gerçek zamanlı yapay zeka sohbetine hakim olmak için yarışırken bile ChatGPT benim tercihim olabilir. Hangi chatbot’u tercih ederseniz edin, yazmaya ara verin ve ses seçeneğini deneyin. Düşündüğünüzden daha faydalı.

(Açıklama: CNET’in ana şirketi Jeff Davis, AI sistemlerini eğiterek ve çalıştırarak Jeff Davis’in telif hakkını ihlal ettiği iddiasıyla Nisan ayında OpenAI’ye karşı bir dava açtı.)

Bir göz atın: ChatGPT’nin viral özelliği: insanları aksiyon figürlerine dönüştürmek

Ses modu tam olarak nedir?

Sesli sohbet (veya “sesli sohbet”), ChatGPT’nin eller serbest modudur ve yazmadan bir AI modeliyle konuşmanıza ve onun sizinle konuştuğunu duymanıza olanak tanır. Mobil, masaüstü ve web uygulamalarında herhangi bir görüşmenin sağ alt kısmında bir ses simgesi bulacaksınız. Düğmeye basarsanız sorunuzu yüksek sesle söyleyebilirsiniz ve ChatGPT soruyu yazıya dökecek, nedenlerini belirtecek ve yanıtlayacaktır. Konuşmayı bitirir bitirmez tekrar dinlemeye başlar ve doğal bir ileri geri diyalog yaratır.

sadece hatırla: Konuşma modu, normal ChatGPT ile aynı büyük dil modelinde çalışır, bu nedenle yine de yanılabilir veya yanlış bilgi alabilirsiniz. Her zaman önemli olan her şeyi kontrol etmelisiniz.

OpenAI bu sesli görüşmenin iki versiyonunu sunar: Standart ses (varsayılan olarak hafif ve ücretsiz seçenek) ve gelişmiş ses (Yalnızca ücretli kullanıcılar için geçerlidir).

Standart Ses öncelikle sesinizi metne dönüştürür ve onu GPT-4o (ve GPT-4o Mini) ile işler; bunun sizinle konuşması biraz daha uzun sürer. Öte yandan Gelişmiş Ses, doğal olarak çok modlu bir model kullanır, yani sizi “dinler” ve ses üretir, böylece konuşma daha doğal olur ve gerçek zamanlı olarak gerçekleşir. Konuşma hızınız veya sesinizdeki duygu gibi kelimeler dışındaki sinyalleri yakalayabilir ve bunlara uyum sağlayabilir.

kullanmak: Ücretsiz kullanıcılar gelişmiş günlük ses önizlemesine erişebilir.

Telefonda ChatGPT ses modu

sürpriz

Nelson Aguilar/CNET

ChatGPT’nin Ses Modu özelliğini kullanmaya başlamak için 7 neden

1. Bu gerçek bir konuşma
Yazmanın aksine, ChatGPT ile konuştuğumda doğru kelimeyi veya geri tuşunu bulmak için her yazım hatasıyla uğraşmıyorum. Sanki bir arkadaşım ya da aile üyemle birlikteymişim gibi “hmmmm”, “beğeniler” ve diğer tuhaf duraklamalarla dolu konuşuyorum. Ses modu, tüm yarım kalmış düşüncelerimle birlikte beliriyor ve ihtiyacım olanı tamamlamama yardımcı olacak tam gelişmiş bir cevap veya soru sağlıyor. Bu zahmetsiz verme ve alma, yazmaktan çok daha doğal geliyor.

2. ChatGPT’yi eller serbest olarak kullanabilirsiniz
Açıkçası, başlamak için hala ChatGPT uygulamasını açmam ve ses modu düğmesine dokunmam gerekiyor, ancak başladığımda artık yapay zeka sohbet robotuyla sohbet etmek için ellerimi kullanmam gerekmiyor. Trafiğe takılıp kalabilirim ve bu yılın sonunda tatile çıkmak istiyorum. Telefonuma dokunmadan uçuşlar, oteller, görülecek yerler, restoranlar ve başka herhangi bir şey hakkında soru sorabiliyorum ve bu konuşma uygulamanın içine kaydediliyor, böylece ChatGPT’nin bana ne söylediğini hatırlamama gerek kalmıyor.

3. Gerçek zamanlı çeviri ile yeni bir dil öğrenmek için iyidir.
Daha önce dil pratiği yapmak için ses modunu kullandığımı, ses modunun iyi olduğunu söylemiştim. İngilizce konuşuyorum ve ChatGPT’de mükemmel Lehçe ile telaffuz ipuçlarıyla yanıt veriyorum. Sadece Ses Moduna şunu sorun: “(Dilimi) pratik etmeme yardım edebilir misin?” ve konuşma başlatmak, temel sözcükler veya sayılar gibi size yardımcı olabilecek çeşitli şekillerde yanıt verecektir. Ve kaldığınız yeri hatırlayın, böylece dersleri tek yönlü alabilirsiniz; Duolingo’ya gerek yok.

4. Gerçek dünyada gördükleriniz hakkında yanıtlar alın.
Bu özellik Gelişmiş Ses’e özeldir, ancak Ses Moduyla muhtemelen en sevdiğim özelliktir. Multimodal süper güçleri sayesinde telefonumun kamerasını açabilir veya video/fotoğraf çekip ChatGPT’den yardım isteyebiliyorum. Örneğin, ikinci el bir mağazada bulduğum bir tabloyu tanımlamakta zorlandım ve sahibinin bu tablonun nereden geldiğine dair hiçbir fikri yoktu. Sesli sohbeti açtım, kameramı açtım ve ses moduna tablonun nereden geldiğini sordum. Birkaç saniye içinde bana tablonun adını, sanatçının adını ve ne zaman yapıldığını söyleyebilirsiniz.

5. Belirli engelleri olan kişiler için iyi bir seçenektir
Az gören veya disleksisi olan herkes için konuşmak kesinlikle yazmaktan daha iyidir. Konuşma modu konuşmanızı yazıya dökebilir ve ardından yanıtınızı seçtiğiniz hızda yüksek sesle okuyabilir (bunu ayarlarınızdan ayarlayabilir veya ChatGPT’ye yavaşlamasını söyleyebilirsiniz). Eller serbest seçeneği motor becerisi sorunları olan herkese yardımcı olur; yapmanız gereken tek şey klavyede çok fazla yazmak zorunda kalmadan başlatmak için tek dokunuş ve durdurmak için tek dokunuştur.

6. Hızlı zeka
Bazen aklıma çok fazla fikir geliyor ve yazabildiğimden daha hızlı düşünüyorum, bu nedenle ChatGPT’nin ses modu hikaye fikirleri söylemek, oturma odam için yeni bir düzen oluşturmak veya hafta boyunca pişirilecek ilginç yemeklere karar vermek için mükemmeldir. Telefonuma bakmak yerine sesli düşündüğüm için fikirlerim özellikle ChatGPT’nin anlık takipleri sayesinde çok daha kolay ve hızlı akıyor. Düşündüğüm şey hakkında parlak bir fikrim olana kadar bu tempo devam ediyor.

7. Anlık özeti dinleyebilirsiniz.
Bir film senaryosu veya ders kitabı gibi 90 sayfalık bir PDF’yi sohbete ekleyin, özet isteyin ve siz çamaşırları katlarken yapay zekanın bunu size yüksek sesle okumasını sağlayın. Bu, herhangi bir belgeyi (bir Wikipedia sayfasını bile) isteğe bağlı olarak bir podcast’e dönüştürmek gibidir.

Ses modu yalnızca basit bir numara değildir; Bu, ChatGPT’yi kullanmanın daha hızlı ve daha doğal bir yoludur. İster trafik işaretlerini tercüme ediyor, ister beyin fırtınası yapıyor, ister yüksek sesle haberleri dinliyor olun, ChatGPT ile konuşmak bir chatbot kullanmaktan çok, küçük bir uzmanla konuşmaya benziyor. Bir kez yüksek sesle düşünmeye alıştığınızda bir daha klavyenin başına dönmeyeceksiniz.

Scroll to Top