中企慧雲申請多模態圖像分割專利,提高圖像分割準確性和掩碼產品圖像完整性
金融界2024年10月29日消息,國家知識產權局信息顯示,北京中企慧雲科技有限公司申請一項名爲“多模態圖像分割方法、裝置、電子設備和計算機可讀介質”的專利,公開號CN 118823359 A,申請日期爲2024年9月。
專利摘要顯示,本公開的實施例公開了多模態圖像分割方法、裝置、電子設備和計算機可讀介質。該方法的一具體實施方式包括:將目標產品圖像輸入至產品圖像特徵提取網絡,得到產品圖像特徵向量集;將產品圖像描述文本信息輸入至文本描述特徵提取網絡,得到產品文本特徵向量;對產品圖像特徵向量集和產品文本特徵向量進行多模態特徵融合和多尺度特徵對齊融合處理,得到多尺度對齊融合特徵向量;對多尺度對齊融合特徵向量和產品文本特徵向量進行特徵增強處理,得到跨模態增強特徵向量對目標產品圖像進行圖像分割處理,得到分割掩碼產品圖像集。該實施方式通過多次多模態融合,充分發揮文本的指導作用,提高圖像分割準確性和分割掩碼產品圖像的完整性。
本文源自:金融界
作者:情報員