ISO/IEC 8859-15
MIME / IANA | ISO-8859-15 |
---|---|
Alias | latin-9, latin-0 |
Standard | ISO/IEC 8859 |
Klassificering | ISO 8859 ( förlängd ASCII , ISO 4873 nivå 1) |
Förlänger | US-ASCII |
Baserat på | ISO-8859-1 |
Föregås av | ISO-8859-1 |
ISO/IEC 8859-15:1999 , Informationsteknik — 8-bitars enkelbyte kodade grafiska teckenuppsättningar — Del 15: Latinskt alfabet nr 9 , är en del av ISO/IEC 8859- serien av ASCII-baserade standardteckenkodningar , först utgåva publicerad 1999. Den kallas informellt Latin-9 (och ett tag Latin-0 ). Den liknar ISO 8859-1 , och därför också avsedd för "västeuropeiska" språk, men ersätter vissa mindre vanliga symboler med eurotecknet och några bokstäver som ansågs nödvändiga: Denna kodning används överlägset mest, nära hälften av använd av tyska, även om detta är den minst använda kodningen för tyska.
A4 | A6 | A8 | B4 | B8 | före Kristus | BD | VARA | |
---|---|---|---|---|---|---|---|---|
8859-1 | ¤ | ¦ | ¨ | ´ | ¸ | ¼ | ½ | ¾ |
8859-15 | € | Š | š | Ž | ž | Œ | œ | Ÿ |
ISO-8859-15 är IANAs föredragna teckenuppsättningsnamn för denna standard när det kompletteras med C0- och C1-kontrollkoderna från ISO/IEC 6429 .
Microsoft har tilldelat teckentabell 28605 aka Windows-28605 till ISO-8859-15. IBM har tilldelat teckentabell 923 ( CCSID 923) till ISO 8859-15.
Alla utskrivbara tecken från både ISO/IEC 8859-1 och ISO/IEC 8859-15 finns också i Windows-1252 . Sedan oktober 2016 använder mindre än 0,1 % (faktiskt för närvarande mindre än 0,02 %) av alla webbplatser ISO-8859-15.
Historia
Identifieraren ISO 8859-15 föreslogs för de samiska språken 1996, som så småningom förkastades, men godkändes som ISO-IR 197 .
Ett förslag kallat ISO 8859-0 gjordes 1997, att ersätta 4 oanvända eller sällan använda ISO 8859-1- tecken ( ¤ , ¨ , ´ och ¸ ) med € , Œ , œ och Ÿ . € blev nödvändigt när euron infördes. Œ och œ är franska ligaturer, och Ÿ behövs så att fransk text kan konverteras från gemener till stora bokstäver och tillbaka igen utan förlust. Ironiskt nog hade de tre sista redan funnits i DEC :s multinationella teckenuppsättning (MCS) 1983, en teckenuppsättning från vilken ECMA-94 (1985) och ISO-8859-1 (1987) härleddes. Eftersom deras ursprungliga kodpunkter nu var upptagna av andra tecken, behövde mindre logiska kodpunkter väljas för att återinföra dem.
Samma förslag rekommenderade också att ersätta ytterligare 6 tecken ( ¢ , ¦ , ± , ¼ , ½ , ¾ ) med "några andra tecken för att täcka maximalt antal språk". För eurotecknet ville en del byta ut plus-minustecknet istället för valutatecknet. Valutatecknet används i vissa applikationer som fältavgränsare och i vissa andra för att indikera delsumma . Det fanns ett starkt motstånd mot detta. En person sa "Det föreslagna «+-» är inte ett adekvat fallback, eftersom denna sekvens, även om den sällan används, redan har en fast matematisk betydelse, helt annorlunda än «±»; och även om en läsare skulle härleda den avsedda betyder, «±», från sammanhanget, «+-» i stället för «±» kommer att skada en fysikers estetiska känslor minst lika mycket som «oe» i stället för en oe ligatur en frankofon.." Till slut och ¢ ersattes inte.
Så småningom valdes fyra tecken ut: Š , š , Ž och ž , [ citat behövs ] som används på finska och estniska för translitterering av ryska lånord och namn. Förslaget bytte namn till ISO 8859-15. [ när? ]
Det gjordes försök att göra ISO 8859-15 till standardteckenuppsättningen för 8-bitars kommunikation, men den kunde aldrig ersätta den populära ISO 8859-1. Den såg viss användning som standardteckenuppsättningen för textkonsolen och terminalprogrammen under Linux när eurotecknet behövdes, men användningen av fullständig Unicode var inte praktisk, men denna har sedan ersatts med UTF-8 .
Rapportering
ISO 8859-15 kodar vad den refererar till som " Latinskt alfabet nr 9". Denna karaktärsuppsättning används i hela Amerika , Västeuropa , Oceanien och stora delar av Afrika . Det används också ofta i de flesta standardromaniseringar av östasiatiska språk.
Varje tecken kodas som ett enda åttabitars kodvärde. Dessa kodvärden kan användas i nästan alla datautbytessystem för att kommunicera på följande språk:
- Moderna språk med fullständig täckning av deras alfabet
|
|
- Anteckningar
Täckning av skiljetecken och apostrof
saknas de korrekta typografiska citattecken , eftersom endast «, », " och ' ingår.
Denna kodning ger inte heller det korrekta tecknet för apostrof, och orienterade enstaka höga citattecken, även om vissa texter använder avståndsgravaccenten och mellanrumsaccenten, som båda är en del av ISO 8859-1, istället för den 6-formade /9-formade citattecken eller apostrof (och detta fungerar tillförlitligt med vissa teckensnittsstilar, där alla dessa tecken visas som lutande kilglyfer).
Codepage layout
Skillnader från ISO-8859-1 har Unicode-kodpunkten som visas under tecknet.
ISO/IEC 8859-15 | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
0x | ||||||||||||||||
1x | ||||||||||||||||
2x | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | E | F | G | H | jag | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | sid | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | |
8x | ||||||||||||||||
9x | ||||||||||||||||
Yxa | NBSP | ¡ | ¢ | £ |
20 € AC |
¥ |
Š 0160 |
§ |
š 0161 |
© | ª | « | ¬ | BLYG | ® | ¯ |
Bx | ° | ± | ² | ³ |
Ž 017D |
µ | ¶ | · |
§ 017E |
¹ | º | » |
Œ 0152 |
œ 0153 |
Ÿ 0178 |
¿ |
Cx | À | Á | Â | Ã | Ä | Å | Æ | Ç | È | É | Ê | Ë | Ì | Í | Î | Ï |
Dx | Ð | Ñ | O | O | O | O | O | × | O | Ù | Ú | Û | Ü | Ý | Þ | ß |
Ex | à | á | â | ã | ä | å | æ | ç | è | e | ê | ë | ì | í | î | ï |
Fx | ð | ñ | o | o | o | o | o | ÷ | o | ù | ú | û | ü | ý | þ | ÿ |
Alias
ISO 8859-15 har också följande leverantörsspecifika alias:
- WE8ISO8859P15 ( Oracle databas )
Se även
externa länkar
- ISO/IEC 8859-15:1999
- ISO/IEC 8859-15:1998 - 8-bitars enkelbyte kodade grafiska teckenuppsättningar, del 15: latinska alfabetet nr 9 ( utkast daterat 1 augusti 1997; ersatt av ISO/IEC 8859-15:1999, publicerat 15 mars , 1999)
- ISO Latin 9 jämfört med ISO Latin 1
- ISO-IR 203 europeisk kompletterande latinsats (16 september 1998)