商湯日日新多模態大模型權威評測第一

北京商報訊(記者 魏蔚)12月19日,北京商報記者獲悉,商湯科技日日新SenseNova多模態大模型,在權威綜合評測權威平臺OpenCompass的多模態評測中取得榜單第一。商湯日日新平均得分達到77.4,領先GPT-4o、Claude 3.5 Sonnet以及國內所有不同尺寸的開源和閉源模型。在涵蓋算術、統計、代數、幾何、數值常識、科學和邏輯的權威數據集MathVista維度上,取得78.4 分。

OpenCompass 多模態評測包含八個核心數據集,從多種視角客觀量化多模態大模型的能力。此次評測中,商湯日日新在幾乎所有維度上都達到或超過GPT-4o水平,其中四個維度上(MMStar、MathVista、OCRBench、MMVet)排名全球第一。