OCR文本識別,場景雖下,大有乾坤
AI賦能千行百業的口號如今正在逐步落地實踐,普羅大眾在日常生活的衣食住行之中也越來越多的感受到AI帶來的智能和快捷。來和福州魚眼鏡頭的小編一起來了解一下吧!
比如社區場景中出入口的人臉識別通道、社區智能垃圾分類、電瓶車禁入電梯系統;辦公場景中人臉識別門禁考勤、票證識別;包裹收寄場景中圖片轉文本的一系列應用等等。
如此來看,不知不覺中,除了人臉識別的應用外,文本識別也已經深入滲透到大眾生活當中,并為我們帶來了諸多便利。
關于文本識別技術,其是計算機視覺和目標識別的基礎研究之一,可以將圖片、掃描件中的文字識別成可以編輯的文本,代替人工手動錄入,近年在深度卷積神經網絡的推波助瀾下飛速進展。
文本識別技術 秒識萬千字符
從目前市場上文本識別技術的應用情況來看,文本識別技術適用于多種應用場景,其實用性完全不亞于名聲在外的人臉識別。
文本識別技術的研究價值巨大,對人工智能在地圖導航、智能交通、信息檢索、機器視覺等領域的發展有較強推動作用,具有廣闊的應用空間和重要的研究意義。
隨著各行各業信息化程度的提升,很多需要文字信息錄入的場合如今也在實現業務流程的數智升級。傳統的票據錄入、單據錄入、各種證件執照等文件信息的錄入以往基本只能人工手動輸入,不僅效率低下,還容易出錯。如今在AI技術賦能之下,卡證票據文檔識別技術的投入使用,可迅速提升文本信息的錄入效率,并且識別正確率基本可達99%以上。
為了讓這項技術能夠更方便的為人所用,目前不少企業已經開發了相當成熟的票證識別應用程序,嵌在各種業務辦理平臺的輔助功能當中,廣泛應用于移動開戶、移動投保、銀行票據錄入、醫療單據錄入等場景,明確識別身份證、行駛證、駕駛證、營業執照、醫療發票等證件票據。
復雜且個性化的文字和各類字符豐富著我們的日常生活,不過,這也給文本識別帶來挑戰。
比如在城市治理場景中,城市街道沿街商鋪各類個性化的招牌,招牌顏色各異、招牌大小不一、隨意變更招牌以及小廣 告粘貼等問題,這不僅影響市容市貌也存在安全隱患。
針對文本識別技術的應用案例中,我們還看到了文本識別在在鋼鐵、能源、交通等行業的應用。比如在鋼鐵、能源領 域,通過編號識別算法自動獲取車輛、集裝箱、鋼卷等目標上的編號信息,助力高效管理;在交通運輸安全管理領域,運用自然場景文字識別算法自動讀取車身文字信息,智能篩選出重點管理車輛,以便針對不同車型采取不同管理方案。

又或者在醫療領域,幫助公司識別藥品說明書,幫助公司快速構建藥品說明書的信息庫;在物流領域,通過文本識別技術快速完成各類單據自動識別,提效降本效果明顯……文本識別技術可適用場景相當廣泛,有了文本識別算法,也藉由機器之“眼”,讓我們從此告別繁瑣的手動輸入低效率方式。
文本識別技術的難點和挑戰
文本識別應用的普及,得益于OCR(Optical Character Recognition)文字識別算法的日趨成熟,不過,從目前市場的文本識別應用情況來看,由于應用場景的多樣性,文本識別也還面臨著一些挑戰:
掃描的單據往往存在虛線干擾、版面缺失、傾斜、暗光、扭曲、噪聲等情況,定位難度大。
文字千變萬化,例如字體、字號、顏色、筆畫寬度等不固定,方向任意;小數點、近似英文數字、特殊符號、連接詞、藝術字等,容易被漏檢或誤識別。
語言種類繁多,經常是中英文混合,多種語言混合等場景,識別難度加大。
表格單據經常存在蓋章(印章覆蓋文字)、錯行(文字溢出表格單元,與表格線交叉)的情況,也造成文字識別干擾,很大的影響識別明確率。
拍照上傳的圖片存在噪聲、模糊、光線變化、形變、復雜背景干擾等問題,對文字定位和識別的明確度是巨大的挑戰。
機器不同于人眼,尤其在現實場景中,字體設計、文本背板、語種以及外部的光線環境等各類因素都可能對機器識別造成干擾,而這也正是當前AI視覺企業在文本識別算法上需要攻破的技術方向。
當然,我們也看到了相關企業在算法研究上取得的進展。比如針對低質量圖像、生僻字、藝術字的識別。
返回列表