Intelligent karaktärsigenkänning

Inom datavetenskap är intelligent teckenigenkänning ( ICR ) en avancerad optisk teckenigenkänning (OCR) eller - snarare mer specifikt - handskriftsigenkänningssystem som gör att teckensnitt och olika stilar av handstil kan läras in av en dator under bearbetning för att förbättra noggrannheten och igenkänningsnivåerna .

Förmågor

De flesta ICR-programvara har ett självlärande system som kallas ett neuralt nätverk , som automatiskt uppdaterar igenkänningsdatabasen för nya handskriftsmönster. Det utökar användbarheten av skanningsenheter för dokumentbehandling, från tryckt teckenigenkänning (en funktion av OCR) till handskriven ärendeigenkänning. Eftersom denna process är inblandad i att känna igen handskrift, kan noggrannhetsnivåerna i vissa fall inte vara särskilt bra men kan uppnå 97 %+ noggrannhetsgrader vid läsning av handstil i strukturerade former. För att uppnå dessa höga igenkänningsfrekvenser används ofta flera läsmotorer i programvaran och var och en ges valfri rösträtt för att bestämma den verkliga läsningen av tecken. I numeriska fält har motorer som är designade för att läsa siffror företräde, medan i alfafält har motorer som är utformade för att läsa handskrivna bokstäver högre valbara rättigheter. När den används i kombination med ett skräddarsytt gränssnittshubb kan handskriven data automatiskt fyllas i ett backoffice- system, vilket undviker mödosam manuell inmatning och kan vara mer exakt än traditionell mänsklig datainmatning.

Automatiserad formulärbehandling

En viktig utveckling av ICR var uppfinningen av Automated Forms Processing 1993 av Joseph Corcoran som tilldelades ett patent på uppfinningen. Detta innebar en process i tre steg för att fånga bilden av formuläret som skulle bearbetas av ICR och förbereda det för att göra det möjligt för ICR-motorn att ge bästa resultat, sedan fånga informationen med hjälp av ICR-motorn och slutligen bearbeta resultaten för att automatiskt validera utdata från ICR-motorn.

Denna tillämpning av ICR ökade användbarheten av tekniken och gjorde den användbar för användning med verkliga former i vanliga affärsapplikationer. Moderna mjukvaruapplikationer använder ICR som en teknik för att känna igen text i formulär som fylls i för hand (handtryckta).

Intelligent ordigenkänning

Intelligent ordigenkänning (IWR) kan känna igen och extrahera inte bara tryckt-handskriven information, utan också kursiv handskrift. ICR känner igen på teckennivå, medan IWR arbetar med fullständiga ord eller fraser. IWR kan fånga ostrukturerad information från vardagliga sidor och sägs vara mer utvecklad än ICR för handtryck. [ citat behövs ]

Inte menat att ersätta konventionella ICR- och OCR-system, IWR är optimerat för att bearbeta verkliga dokument som innehåller mestadels fritt format, svåra att känna igen datafält som i sig är olämpliga för ICR. Detta innebär att den högsta och bästa användningen av IWR är att eliminera en hög procentandel av manuell inmatning av handskrivna data och fält för körning på hand på dokument som annars bara skulle kunna knappas in av människor.

Se även