Home ISO 8859 De Euro in de praktijk ISO-8859-3 - Esperanto

ISO-8559-2

In een eerdere aflevering is uitvoerig het internet en de problemen met fonts en ISO-standaards aan de orde geweest. Wie denkt dat nu langzamerhand het een en ander is opgelost heeft het mis. Het zelf maken van homepages met Poolse tekens is dankzij de medewerking van Dirk Hagedorn door de toevoeging van de tag !html_ignore_8bit zo goed als opgelost.

De homepages geplaatst op het net konden aan de andere kant goed gelezen worden mits de juiste fonts met ISO Latin 2 waren ingesteld [d.w.z. aan de Netscape cq MS Explorer kant]. Pas toen kreeg ik van de anderen te horen dat leuk en aardig het Pools er wel goed uitzag maar dat de Nederlandse accenten [a, e, i, o, en u met trema en accent aigue en grave] niet om aan te zien waren.

Wat nu? In de betreffende aflevering had ik ook al vermeld dat That's Write versie 3 vanaf 1993 diverse tabellen bleek te hanteren voor de invoer en uitvoer van ASCII teksten. Ik had toen subiet speciale tabellen voor invoer en uitvoer gemaakt van de eigen Poolse standaard naar ISO-8859-2 en vice versa. Ik had er niet bij stil gestaan dat de Nederlandse accenten in de ons bekende [Atari] ASCII-reeks staan op een van ISO-8859-2 afwijkende plaats. Overigens zijn de posities van juist die tekens voor ISO-8859-1 en -2 hetzelfde! En dat betekende dat ik aan de fake SPDCHAR.map niets hoefde te veranderen, maar wel dat ik de tabellen van That's Write diende uit te breiden. Toen dit eenmaal was gedaan bleken ook de Nederlandse accenten feilloos op de Pentium MMX'en zichtbaar!


Terwijl deze problemen zich voordeden realiseer je onmiddelijk ook dat er nog andere tekens zijn die de mist in gaat om de eenvoudige reden dat ze niet voorkomen in noch ISO08859-1 noch in ISO8859 -2. Zo kan ik weinig met de fraaie aanhalingstekens openen [onder] en sluiten [boven]. Ze zitten er niet in! En dat geldt voor nog een aantal tekens. En dan denk je ereens aan dat in HTML een aantal tekens met de &. .; worden gecodeerd. Maar nee, daar vindt je nu net de tekens boven de 128 die wel in ISO-8859-1 zijn gecodeerd!

Als de diverse ISO Latin standaards [ISO-8859-1, 2, 3, 4, 9, 10, 13] met elkaar worden vergeleken dan valt onmiddelijk op dat de talen Duits en Engels volledig aan hun trekken komen voorzover het om letters met diacritische tekens gaat. Des te vreemder is het dan te moeten constateren dat bij alle ISO Latin standaards wordt aangegeven dat voor het Frans nog 3 lettertekens niet meegenomen konden worden!? Het zijn de Oe, oe-ligatuur en de Y met trema [y met trema is wel te coderen]. Voor het Nederlands zou de ij, IJ-ligatuur misschien interessant zijn, echter ze komen niet voor in enige ISO-8859 standaard. Wel zitten ze in de grote letterbak [zoals bij Papyrus bereikbaar via Unicode].


ISO Latin 7 is nog niet geaccepteerd maar daar wordt - omdat Letten en Litauers ISO Latin 4 niet willen gebruiken aangezien er geen &..; tekens in zitten - een mix van Latin 1 en 2 gemaakt waardoor het aantal talen dat er gebruik van kan maken enorm afneemt. Immers de posities 128-159 bljven ongedefiniëerd, en een groot aantal tekens hebben moeten plaatsmaken voor de &..; tekens.

Bij de 3 standaards ISO Latin 1, 2, en 7 zitten boven de positie 128 steevast op dezelfde plaats de A, O, U, a, o en u met umlaut/trema; en de O , E, o en e met accent aigu; verder de Duitse sz-ligatuur, het paragraaf-teken en het maal- resp. deel-teken.

omschrijving / description kolom/pos. decimaal
A, a met umlaut 12/4, 14/4 196, 228
O, o met accent aigue 13/3, 15/3 211, 243
O, o met umlaut 13/6, 15/6 214, 246
U, u met umlaut 13/12, 15/12 220, 252
E, e met accent aigu 12/9, 14/9 201, 233
sz ligatuur 13/15 223
paragraaf 10/7 167
maal-, deel-teken 13/7, 15/7 215, 247


Copyright © Rein Bakhuizen van den Brink
Last updated on 26 december 2000

Home ISO 8859 De Euro in de praktijk ISO-8859-3 - Esperanto