|
公司基本資料信息
|
一、產品簡介:
表格、票據自動識別SDK是一種通用的數據批量采集技術,適用于采集具有表格特征的表單、問卷、票據的數據,通過掃描、圖像處理、自動分類、OCR(光學字符識別)技術,將表格圖像中的數據信息準確、快速、真實地提取并保存,數據結果可導出為標準的數據格式,如Excel表、XML文件,與企事業單位的ERP、CRM等系統實現無縫結合。系統支持中英文、數字、符號等多類型字符的手寫體、印刷體識別。
二、應用背景:
表格是一種高度精煉,集中的信息表達手段,紙質表格被廣泛的應用于數據采集,將紙質表格數據轉換成電子數據是信息化必然趨勢。傳統的人工數據錄入方式效率低下、差錯率高、成本昂貴,北京文通科技結合其在OCR(光學字符識別)領域的尖端技術,為客戶提供企業級的數據采集方案,在數據采集和數據應用之間架起高速通道。
三、SDK概述:
3.1工作流程概述
3.2 SDK識別性能參數:
識別字符類型
印刷體:中文(簡繁體)、英文、數字
手寫體:中文(簡繁體)、英文、數字
符號類:標識碼、條碼、 CheckBox、√、▇、○、●等,可定制符號
識別速度
單張表格的平均識別速度在1.0秒鐘左右;
識別率
對于版面整潔的印刷字符的識別,正確率達99.96%
對于規范手寫數字、英文的識別,正確率達98.5%
對于規范手寫漢字的識別,正確率在 85%左右;
3.3 SDK主要模塊及功能特點:
表格模板編輯器:輕松快速定義識別模板;
圖像預處理模塊:自動去黑邊、自動糾偏、去噪聲、圖像自動旋轉、多種二值化方法處理;
表格自動分類:系統能自動區分當前表格、票據的業務類別,實現全自動歸檔;
字符識別引擎:支持識別豐富的文字、符號類型;
快速校對工具:集字校對器、橫向校對器
3.4 SDK開發環境
計算機性能:CPU-2.0GHz,內存-512MB,硬盤-2G;
操作系統:Win98/Win 2000/Win XP/2003 Server/vista/2008 Server/Win 7;
API接口:以標準的DLL(動態鏈接庫)、OCX控件方式提供,支持VB、C#、Delphi、PB、 C/C++/VC++、Java等常用程序語言的調用;
四、我們的技術服務:
我們的宗旨是為客戶提供企業級的數據采集技術,我們的技術服務內容包括識別需求評估、表格規范設計、模板定制、二次開發技術支持,在企事業客戶開發應用系統的過程中,我們將全程跟蹤,為客戶方提供專業團隊的技術服務。