OpenAI最新模型 可即時翻譯對話

圖/美聯社

眼看生成式AI市場競爭日漸激烈,OpenAI加緊腳步推陳出新,近日發表最新AI模型GPT-4o,不僅能接收文字、影像、語音指令,且AI運算比上一代快1倍,語音對答速度媲美真人對話,甚至能充當口譯員。

OpenAI技術長穆拉蒂(Mira Murati)13日於線上直播發表會上表示,GPT-4o無論在文字、影像、語音的AI運算上皆「大幅加快速度」。她表示GPT-4o的最後一個字母來自「omni」,意指具備全方位功能滿足所有使用者需求,不僅能處理50種語言指令,且速度比GPT-4 Turbo快1倍,成本只有一半。

OpenAI研究員Mark Chen表示,GPT-4o能根據使用者臉部表情分析情緒,還具備更強大的語音對話能力,最快能在232毫秒內回答使用者語音提問,媲美真人對話速度。

Mark Chen在線上發表會展示如何利用GPT-4o爲孩子講牀邊故事,且GPT-4o還能因應不同要求隨時切換語調,就連用歌唱方式說故事也不成問題。GPT-4o對話如流的語音性能也能充當口譯員,讓講義大利文的穆拉蒂與講英文的Mark Chen順利對話。

GPT-4o即日起開放ChatGPT Plus及Team付費訂戶使用,隨後服務對象將擴大至Enterprise企業用戶,預計20日起開放所有免費用戶使用,但免費用戶的使用次數受限。

2022年11月OpenAI推出第一代ChatGPT後,隨即成爲史上下載次數成長最快的應用程式,如今每週經常性用戶量已達1億人。這段期間AI新創公司接連加入戰局,但社會大衆對AI認知有限,令不少人擔心AI發展過快。

穆拉蒂表示OpenAI推出GPT-4o的目的之一就是「揭開AI神秘面紗」,讓所有人都能實際體驗AI運算。OpenAI也在13日推出桌機版ChatGPT,同樣是希望擴大用戶羣。