字形碼相似度計(jì)算方法和關(guān)鍵字詞提取方法、系統(tǒng)及裝置

基本信息

申請(qǐng)?zhí)?/td> CN202110877695.1 申請(qǐng)日 -
公開(公告)號(hào) CN113313100A 公開(公告)日 2021-08-27
申請(qǐng)公布號(hào) CN113313100A 申請(qǐng)公布日 2021-08-27
分類號(hào) G06K9/00;G06F40/109;G06F40/126 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 張潔;周揚(yáng);劉自成 申請(qǐng)(專利權(quán))人 南京智盈人工智能研究院有限公司
代理機(jī)構(gòu) 南京中擎科智知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 韓賽
地址 210012 江蘇省南京市雨花臺(tái)區(qū)寧雙路19號(hào)云密城2號(hào)樓13層
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及字符智能識(shí)別領(lǐng)域,公開了字形碼相似度計(jì)算方法和關(guān)鍵字詞提取方法、系統(tǒng)及裝置,其技術(shù)方案要點(diǎn)是從待識(shí)別文字圖片中識(shí)別得到電子文本;在電子文本中設(shè)定要提取的關(guān)鍵字;根據(jù)關(guān)鍵字的字形碼,利用字形碼相似度計(jì)算方法計(jì)算關(guān)鍵字與字庫(kù)中所有字的字形碼相似度;在關(guān)鍵字與字庫(kù)中所有字的字形碼相似度得出后,找出所有與所述關(guān)鍵字的字形碼相似度達(dá)到設(shè)定閾值的字,即為關(guān)鍵字的相似字;從所述電子文本中提取所述關(guān)鍵字和所述相似字,在圖片文本識(shí)別的場(chǎng)景下,準(zhǔn)確找到關(guān)鍵字的概率更高,更加有利于實(shí)際的使用。