Optisk teckenigenkänning (Unicode-block)

Optisk teckenigenkänning
Räckvidd
U+2440..U+245F (32 kodpunkter)
Plan BMP
Manus Allmänning
Symboluppsättningar OCR-kontroller
Tilldelad 11 kodpunkter
Oanvänd 21 reserverade kodpunkter
Källstandarder ISO 2033
Unicode versionshistorik
1.0.0 (1991) 11 (+11)
Diagramkod
diagram
Obs :

Optical Character Recognition är ett Unicode-block som innehåller signaltecken för OCR- och MICR -standarder.

Blockera


Optisk teckenigenkänning Officiellt koddiagram för Unicode Consortium (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+244x
U+245x
Notes
1. ^ Från och med Unicode version 15.0
2. ^ Grå områden indikerar icke-tilldelade kodpunkter

Underrubriker

Blocket för optisk teckenigenkänning har tre informella underrubriker (grupperingar) inom sin karaktärssamling: OCR-A, MICR och OCR.

OCR-A

En delvis redigerad tysk check , som visar användningen av ⑂, ⑀ och ⑁ i den maskinläsbara raden

OCR-A-underrubriken innehåller sex tecken hämtade från OCR-A- teckensnittet som beskrivs i ISO 1073-1:1976-standarden: U+2440 OCR HOOK , U+2441 OCR CHAIR , U+2442 OCR FORK , U+2443 OCR INVERTERAD GAFFEL , U+2444 OCR Bältesspänne och U+2445 OCR fluga . OCR flugan får det informativa aliaset "unik asterisk".

MICR

En check i brittisk stil för en fiktiv bank, som visar användningen av ⑆, ⑈ och ⑉ i den maskinläsbara raden

MICR-underrubriken innehåller fyra skiljetecken för bankcheckidentifierare , tagna från teckenigenkänning av magnetiska bläcktecken E-13B (kodifierad i ISO 1004:1995-standarden): U+2446 OCR BRANCH BANK IDENTIFICATION , U+2447 OUNT OF OCR KONTROLLERA , U+2448 OCR DASH och U+2449 OCR KUNDKONTONUMMER .

De två sistnämnda tecknen är felnamn: deras namn ändrades oavsiktligt när de namngavs i 1993 (första) upplagan av ISO/IEC 10646, ett misstag som hade funnits sedan Unicode 1.0.0. Även om deras formella namn förblir oförändrade på grund av Unicodes stabilitetspolicy, har de båda korrigerade normativa alias : U+2448 ⑈ är MICR ON US SYMBOL och U+2449 ⑉ är MICR DASH SYMBOL (standarden noterar att "Unicode-teckennamnen inkluderar flera felaktiga benämningar").

Dessa symboler hade tidigare kodats av ISO-IR-98-kodningen definierad av ISO 2033 :1983, där de helt enkelt hette SYMBOL ETT till SYMBOL FYRA . Alla fyra tecken har informativa alias i Unicode-diagrammen: "transit", "belopp", "på oss" respektive "dash".

OCR

OCR-underrubriken består av ett enda tecken: U+244A OCR DUBBELT BACKSTRECK .

Historia

Följande Unicode-relaterade dokument registrerar syftet och processen för att definiera specifika tecken i blocket för optisk teckenigenkänning:

Version Slutliga kodpunkter Räkna L2 ID WG2 ID Dokumentera
1.0.0 U+2440..244A 11 (att vara bestämd)
L2/10-416R Moore, Lisa (2010-11-09), "Consensus 125-C39", UTC #125 / L2 #222 Minutes , Skapa två formella alias, U+2448 MICR PÅ US SYMBOL och U+2449 MICR DASH SYMBOL för Unicode 6.1.
N4103 "T.3. Optisk teckenigenkänning", obekräftat protokoll från WG 2 möte 58 , 2012-01-03
L2/22-065 Whistler, Ken (2022-04-13), "Opt Subject: Unicode 14.0 "Optical Character Recognition"-koddiagram [påverkar U+2447]", Redaktionskommitténs rapport och rekommendationer för UTC #171Meeting