字形碼相似度計(jì)算方法和關(guān)鍵字詞提取方法、系統(tǒng)及裝置
基本信息

| 申請(qǐng)?zhí)?/td> | CN202110877695.1 | 申請(qǐng)日 | - |
| 公開(公告)號(hào) | CN113313100A | 公開(公告)日 | 2021-08-27 |
| 申請(qǐng)公布號(hào) | CN113313100A | 申請(qǐng)公布日 | 2021-08-27 |
| 分類號(hào) | G06K9/00;G06F40/109;G06F40/126 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 張潔;周揚(yáng);劉自成 | 申請(qǐng)(專利權(quán))人 | 南京智盈人工智能研究院有限公司 |
| 代理機(jī)構(gòu) | 南京中擎科智知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 韓賽 |
| 地址 | 210012 江蘇省南京市雨花臺(tái)區(qū)寧雙路19號(hào)云密城2號(hào)樓13層 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明涉及字符智能識(shí)別領(lǐng)域,公開了字形碼相似度計(jì)算方法和關(guān)鍵字詞提取方法、系統(tǒng)及裝置,其技術(shù)方案要點(diǎn)是從待識(shí)別文字圖片中識(shí)別得到電子文本;在電子文本中設(shè)定要提取的關(guān)鍵字;根據(jù)關(guān)鍵字的字形碼,利用字形碼相似度計(jì)算方法計(jì)算關(guān)鍵字與字庫(kù)中所有字的字形碼相似度;在關(guān)鍵字與字庫(kù)中所有字的字形碼相似度得出后,找出所有與所述關(guān)鍵字的字形碼相似度達(dá)到設(shè)定閾值的字,即為關(guān)鍵字的相似字;從所述電子文本中提取所述關(guān)鍵字和所述相似字,在圖片文本識(shí)別的場(chǎng)景下,準(zhǔn)確找到關(guān)鍵字的概率更高,更加有利于實(shí)際的使用。 |





