Home Papyrus Papyrus Papyrus 5

Papyrus 4 en Unicode

Bij Papyrus 4 - afgaande op de Duitse beta-versie 4.03 en versie 4.09 - zijn er ten opzichte van de Papyrus 3.5/6 versies weer grootse veranderingen aangebracht. De in het kader van dit font-verhaal meest interesaante is dat bij de opslag van tekst met twee mogelijkheden wordt gewerkt: opslag volgens ASCII als bij de compatibiliteit gekozen wordt voor de Atari-Belegung of volgens de erweiterte ofwel Unicode-tabel. In het eerste geval houdt Papyrus rekening met de mapping volgens SPDCHAR.map, in het tweede niet! Hoe de hogere ASCII-waarden dan ingevuld zijn is me nog niet geheel duidelijk maar doet me denken aan het probleem dat ik bij CAB en HTML-browser ondervond - een eigenzinnige indeling niet conform de SPDCHAR.map.

Bij de TW4 Unicode.enc tabel vallen de posities 193-197 onder Allgemeine Zeichensatz, 198-210 onder Latin-1 en 211 onder European Latin, alle onderverdelingen bij Papyrus 4 van de Unicode-tabel.

In de erweiterte situatie is het mogelijk om alle tekens uit de Speedo-fonts te gebruiken, ze krijgen een plaats die intern in Papyrus gecodeerd wordt wordt als U+hexadecimaal. De tekst met zulke tekens is op te slaan in het PAP-formaat en weer terug te lezen. Bij het exporteren naar ASCII-tekst gebeurt er iets eigenaardig. Bij versie 4.03 verdwijnt alles op de lagere nummers [onder 256] na, bij versie 4.09 vinden we als ASCII-tekst de volgende soort codes:

        [U+173][U+160][U+171][U+17D][U+16E][U+15F]

Dit doet sterk denken aan de oplossing van WordPerfect met haar International Characterset, en als tussenoplossing allicht te verkiezen boven een dubbelzinnig 16-bits code die ook geinterpreteerd zou kunnen worden als 2 8-bits codes.


Copyright © Rein Bakhuizen van den Brink
Last updated on 26 december 2000

Home Papyrus Papyrus Papyrus 5