☰

OpenAI最新模型可即時翻譯對話

圖／美聯社

眼看生成式AI市場競爭日漸激烈，OpenAI加緊腳步推陳出新，近日發表最新AI模型GPT-4o，不僅能接收文字、影像、語音指令，且AI運算比上一代快1倍，語音對答速度媲美真人對話，甚至能充當口譯員。

OpenAI技術長穆拉蒂（Mira Murati）13日於線上直播發表會上表示，GPT-4o無論在文字、影像、語音的AI運算上皆「大幅加快速度」。她表示GPT-4o的最後一個字母來自「omni」，意指具備全方位功能滿足所有使用者需求，不僅能處理50種語言指令，且速度比GPT-4 Turbo快1倍，成本只有一半。

OpenAI研究員Mark Chen表示，GPT-4o能根據使用者臉部表情分析情緒，還具備更強大的語音對話能力，最快能在232毫秒內回答使用者語音提問，媲美真人對話速度。

Mark Chen在線上發表會展示如何利用GPT-4o爲孩子講牀邊故事，且GPT-4o還能因應不同要求隨時切換語調，就連用歌唱方式說故事也不成問題。GPT-4o對話如流的語音性能也能充當口譯員，讓講義大利文的穆拉蒂與講英文的Mark Chen順利對話。

GPT-4o即日起開放ChatGPT Plus及Team付費訂戶使用，隨後服務對象將擴大至Enterprise企業用戶，預計20日起開放所有免費用戶使用，但免費用戶的使用次數受限。

2022年11月OpenAI推出第一代ChatGPT後，隨即成爲史上下載次數成長最快的應用程式，如今每週經常性用戶量已達1億人。這段期間AI新創公司接連加入戰局，但社會大衆對AI認知有限，令不少人擔心AI發展過快。

穆拉蒂表示OpenAI推出GPT-4o的目的之一就是「揭開AI神秘面紗」，讓所有人都能實際體驗AI運算。OpenAI也在13日推出桌機版ChatGPT，同樣是希望擴大用戶羣。

OpenAI最新模型 可即時翻譯對話

相關資訊

OpenAI最新模型可即時翻譯對話