Optisk teckenigenkänning (Unicode-block)
Optisk teckenigenkänning | |
---|---|
Räckvidd |
U+2440..U+245F (32 kodpunkter) |
Plan | BMP |
Manus | Allmänning |
Symboluppsättningar | OCR-kontroller |
Tilldelad | 11 kodpunkter |
Oanvänd | 21 reserverade kodpunkter |
Källstandarder | ISO 2033 |
Unicode versionshistorik | |
1.0.0 (1991) | 11 (+11) |
Diagramkod | |
diagram | |
Obs : |
Optical Character Recognition är ett Unicode-block som innehåller signaltecken för OCR- och MICR -standarder.
Blockera
Optisk teckenigenkänning Officiellt koddiagram för Unicode Consortium (PDF) |
||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+244x | ⑀ | ⑁ | ⑂ | ⑃ | ⑄ | ⑅ | ⑆ | ⑇ | ⑈ | ⑉ | ⑊ | |||||
U+245x | ||||||||||||||||
Notes |
Underrubriker
Blocket för optisk teckenigenkänning har tre informella underrubriker (grupperingar) inom sin karaktärssamling: OCR-A, MICR och OCR.
OCR-A
OCR-A-underrubriken innehåller sex tecken hämtade från OCR-A- teckensnittet som beskrivs i ISO 1073-1:1976-standarden: U+2440 ⑀ OCR HOOK , U+2441 ⑁ OCR CHAIR , U+2442 ⑂ OCR FORK , U+2443 ⑃ OCR INVERTERAD GAFFEL , U+2444 ⑄ OCR Bältesspänne och U+2445 ⑅ OCR fluga . OCR flugan får det informativa aliaset "unik asterisk".
MICR
MICR-underrubriken innehåller fyra skiljetecken för bankcheckidentifierare , tagna från teckenigenkänning av magnetiska bläcktecken E-13B (kodifierad i ISO 1004:1995-standarden): U+2446 ⑆ OCR BRANCH BANK IDENTIFICATION , U+2447 OUNT OF OCR KONTROLLERA , U+2448 ⑈ OCR DASH och U+2449 ⑉ OCR KUNDKONTONUMMER .
De två sistnämnda tecknen är felnamn: deras namn ändrades oavsiktligt när de namngavs i 1993 (första) upplagan av ISO/IEC 10646, ett misstag som hade funnits sedan Unicode 1.0.0. Även om deras formella namn förblir oförändrade på grund av Unicodes stabilitetspolicy, har de båda korrigerade normativa alias : U+2448 ⑈ är MICR ON US SYMBOL och U+2449 ⑉ är MICR DASH SYMBOL (standarden noterar att "Unicode-teckennamnen inkluderar flera felaktiga benämningar").
Dessa symboler hade tidigare kodats av ISO-IR-98-kodningen definierad av ISO 2033 :1983, där de helt enkelt hette SYMBOL ETT till SYMBOL FYRA . Alla fyra tecken har informativa alias i Unicode-diagrammen: "transit", "belopp", "på oss" respektive "dash".
OCR
OCR-underrubriken består av ett enda tecken: U+244A ⑊ OCR DUBBELT BACKSTRECK .
Historia
Följande Unicode-relaterade dokument registrerar syftet och processen för att definiera specifika tecken i blocket för optisk teckenigenkänning:
Version | Slutliga kodpunkter | Räkna | L2 ID | WG2 ID | Dokumentera |
---|---|---|---|---|---|
1.0.0 | U+2440..244A | 11 | (att vara bestämd) | ||
L2/10-416R |
Moore, Lisa (2010-11-09), "Consensus 125-C39", UTC #125 / L2 #222 Minutes , Skapa två formella alias, U+2448 MICR PÅ US SYMBOL och U+2449 MICR DASH SYMBOL för Unicode 6.1. |
||||
N4103 | "T.3. Optisk teckenigenkänning", obekräftat protokoll från WG 2 möte 58 , 2012-01-03 | ||||
L2/22-065 | Whistler, Ken (2022-04-13), "Opt Subject: Unicode 14.0 "Optical Character Recognition"-koddiagram [påverkar U+2447]", Redaktionskommitténs rapport och rekommendationer för UTC #171Meeting | ||||