這兩週常開高速公路,跟 ChatGPT 與 Gemini 都聊了不少,分享一下心得。
ChatGPT 的專長真的是 Chat,語音聊天非常強,即使是免費版本,都能一路從台中聊到台北。免費版的語音稍微生硬一點,雖然禮貌,但回覆就是順著你說,不太會有什麼洞見;請他去搜尋資料,有時候回報也不太能跟你的要求對齊。
我用過 Plus 的聊天,真的比較好,模型跟優先權都更高,很難量化,但對語言敏感的人應該都感覺得到。我也有朋友訂閱 Pro 來聊天,他非常滿意,甚至一邊運動一邊戴耳機跟他聊都可以,可見音訊處理容錯率超高。
Gemini 我用的是入門付費版本,但他對網路穩定性的要求「非常高」,所以明明網路其實是通的,只是車子在跑,有時可能換個基地台,或稍微波動一下,他就會自己斷線,體驗不太好。
我問 ChatGPT 他為什麼這麼穩,他一開始唬我說語音有本地模型分擔,後來自己回家查才知道其實全部跑在雲端,手機只負責收音跟播放。免費版用的是三段式架構(語音轉文字 → GPT-4o mini → 語音合成),付費版的 Advanced Voice Mode 則是 GPT-4o 直接聽聲音、直接吐聲音,沒有中間層。
我猜真正讓他穩的,是串流的容錯設計、模型整合度,以及換基地台時的處理韌性,所以即使在高速公路上對話,也不太會斷。
總之,想讓自己煩躁就跟 Gemini 聊,想要有人穩定聊天就用免費版 ChatGPT,付錢的又真的比較好,看大家的需求囉。
封面圖:Gemini 生成圖(依「黃昏高速公路駕駛視角+儀表板上手機顯示語音波形」指令產出)。