|
公司基本資料信息
|
一、產(chǎn)品簡(jiǎn)介:
表格、票據(jù)自動(dòng)識(shí)別SDK是一種通用的數(shù)據(jù)批量采集技術(shù),適用于采集具有表格特征的表單、問(wèn)卷、票據(jù)的數(shù)據(jù),通過(guò)掃描、圖像處理、自動(dòng)分類、OCR(光學(xué)字符識(shí)別)技術(shù),將表格圖像中的數(shù)據(jù)信息準(zhǔn)確、快速、真實(shí)地提取并保存,數(shù)據(jù)結(jié)果可導(dǎo)出為標(biāo)準(zhǔn)的數(shù)據(jù)格式,如Excel表、XML文件,與企事業(yè)單位的ERP、CRM等系統(tǒng)實(shí)現(xiàn)無(wú)縫結(jié)合。系統(tǒng)支持中英文、數(shù)字、符號(hào)等多類型字符的手寫體、印刷體識(shí)別。
二、應(yīng)用背景:
表格是一種高度精煉,集中的信息表達(dá)手段,紙質(zhì)表格被廣泛的應(yīng)用于數(shù)據(jù)采集,將紙質(zhì)表格數(shù)據(jù)轉(zhuǎn)換成電子數(shù)據(jù)是信息化必然趨勢(shì)。傳統(tǒng)的人工數(shù)據(jù)錄入方式效率低下、差錯(cuò)率高、成本昂貴,北京文通科技結(jié)合其在OCR(光學(xué)字符識(shí)別)領(lǐng)域的尖端技術(shù),為客戶提供企業(yè)級(jí)的數(shù)據(jù)采集方案,在數(shù)據(jù)采集和數(shù)據(jù)應(yīng)用之間架起高速通道。
三、SDK概述:
3.1工作流程概述
3.2 SDK識(shí)別性能參數(shù):
識(shí)別字符類型
印刷體:中文(簡(jiǎn)繁體)、英文、數(shù)字
手寫體:中文(簡(jiǎn)繁體)、英文、數(shù)字
符號(hào)類:標(biāo)識(shí)碼、條碼、 CheckBox、√、▇、○、●等,可定制符號(hào)
識(shí)別速度
單張表格的平均識(shí)別速度在1.0秒鐘左右;
識(shí)別率
對(duì)于版面整潔的印刷字符的識(shí)別,正確率達(dá)99.96%
對(duì)于規(guī)范手寫數(shù)字、英文的識(shí)別,正確率達(dá)98.5%
對(duì)于規(guī)范手寫漢字的識(shí)別,正確率在 85%左右;
3.3 SDK主要模塊及功能特點(diǎn):
表格模板編輯器:輕松快速定義識(shí)別模板;
圖像預(yù)處理模塊:自動(dòng)去黑邊、自動(dòng)糾偏、去噪聲、圖像自動(dòng)旋轉(zhuǎn)、多種二值化方法處理;
表格自動(dòng)分類:系統(tǒng)能自動(dòng)區(qū)分當(dāng)前表格、票據(jù)的業(yè)務(wù)類別,實(shí)現(xiàn)全自動(dòng)歸檔;
字符識(shí)別引擎:支持識(shí)別豐富的文字、符號(hào)類型;
快速校對(duì)工具:集字校對(duì)器、橫向校對(duì)器
3.4 SDK開發(fā)環(huán)境
計(jì)算機(jī)性能:CPU-2.0GHz,內(nèi)存-512MB,硬盤-2G;
操作系統(tǒng):Win98/Win 2000/Win XP/2003 Server/vista/2008 Server/Win 7;
API接口:以標(biāo)準(zhǔn)的DLL(動(dòng)態(tài)鏈接庫(kù))、OCX控件方式提供,支持VB、C#、Delphi、PB、 C/C++/VC++、Java等常用程序語(yǔ)言的調(diào)用;
四、我們的技術(shù)服務(wù):
我們的宗旨是為客戶提供企業(yè)級(jí)的數(shù)據(jù)采集技術(shù),我們的技術(shù)服務(wù)內(nèi)容包括識(shí)別需求評(píng)估、表格規(guī)范設(shè)計(jì)、模板定制、二次開發(fā)技術(shù)支持,在企事業(yè)客戶開發(fā)應(yīng)用系統(tǒng)的過(guò)程中,我們將全程跟蹤,為客戶方提供專業(yè)團(tuán)隊(duì)的技術(shù)服務(wù)。