南京魔數團申請流式視頻理解與關鍵信息結構化提取方法及系統專利,提高用戶對於視頻內容理解的效率和準確性
金融界2024年12月2日消息,國家知識產權局信息顯示,南京魔數團信息科技有限公司申請一項名爲“一種流式視頻理解與關鍵信息結構化提取的方法及系統”的專利,公開號CN 119049474 A,申請日期爲2024年9月。
專利摘要顯示,本申請公開了一種流式視頻理解與關鍵信息結構化提取的方法及系統,所述方法包括:採集視頻數據並確定應用類型,根據應用類型按照預設每幀序列時長對視頻數據分解成視頻幀序列;採用多特徵綜合決策算法識別視頻幀序列中關鍵幀;採用預設語音模型識別視頻幀序列中語音信息並轉化爲文本,採用自然語言處理技術獲取關鍵文本信息;按照預設映射方式對關鍵幀與關鍵文本信息進行映射關聯;將關鍵幀的特徵向量與關聯的關鍵文本信息的特徵向量進行融合,結合深度學習模型進行聯合推理,獲取視頻的聯合推理結果;根據視頻的聯合推理結果,提取視頻中關鍵信息並以結構化的形式進行存儲。本申請能夠提高用戶對於視頻內容理解的效率和準確性。
本文源自:金融界
作者:情報員