數位部展示AI評測能量 抓出模型中文用語差異

ChatGPT掀起生成式AI熱潮,如何檢視訊息正確性成評測重點。數位部AI評測中心今天展示成果,其中在準確性項目,會測試模型能分辨出臺灣與中國用語差異,以及能否正確回答臺灣在地文化知識等。圖/聯合報系資料照片

ChatGPT掀起生成式AI熱潮,如何檢視訊息正確性成評測重點。數位部AI評測中心今天展示成果,其中在準確性項目,會測試模型能分辨出臺灣與中國用語差異,以及能否正確回答臺灣在地文化知識等。

數位部長唐鳳今天下午視察AI產品與系統評測中心,她受訪時表示,AI評測中心接軌全球最先進國家包含美國、歐盟與英國等做法,藉由接軌與全球共同發展AI評測體系,協助各行業導入生成式AI時,保持安全、又能維護隱私與人權等價值。

AI評測中心團隊分享案例,AI評測中心會透過題目來測試語言模型是否可以判斷臺灣與中國用語差異,例如筆電設備,在臺灣稱爲筆記型電腦,中國則稱筆記本電腦,同時,AI評測中心也會透過問題,測試模型能否正確回答臺灣在地文化知識與觀光景點等。

不過目前部分評測項目涉及社會安全,仍有賴人工審議,還無法自動檢測,唐鳳表示,將持續蒐集外界想法進行測試。

至於未來評測中心是否可能收費,唐鳳僅說,由制度推動委員會決定。