Home ISO 8859 ISO-8859-5 Unicode

ISO-8859-7

Bij de meeste voor Windows geleverde fonts zitten de Griekse lettertekens conform de Unicode en zijn ze goed te benaderen. Iets moeizamer wordt het als het gaat om 'klassiek' Grieks.

Wie ooit Grieks en Latijn gehad heeft op school weet hoe lastig die leraren toen deden over het 'accent' en de dichterlijke wijze van uitspraak. Wie denk dat alle klassieke tekens met accenten netjes te vinden zijn in de uitgebreide fonts die b.v met M$ Office worden meegeleverd heeft het mis. De tekens staan allemaal [?] weliswaar in de lange lijst van Unicode/ISO 10646 echter een zeer beperkt aantal fonts heeft ze [grotendeels] beschikbaar zoals b.v de 'Athena_Roman':




Jammer is dat op positie 497 een Cyrillisch teken beschadigd is, maar verder....


Vlak voor de Kerst van 1997 struikelde ik over een vraag van een Griek die een probleem had met de Crystal Atari Browser [CAB] om web-pagina's in z'n eigen taal te lezen. Hij had weliswaar TrueType fonts met Griekse karakters maar kreeg toch niets zinnigs op z'n scherm. Een landgenoot - Panayiotis Andriopoulos -herkende het probleem en schreef hem:

Hi George

The problem you mention is part because of the conversion tables that NVDI uses and part of the "reverse" translation CAB does in order to conform with the iso character sets. Although this scheme works ok for iso-8859-1, also known as Latin-1, the same is not true for the greek character set iso-8859-7.

The solution I have found is two patches, one for NVDI and one for CAB, that simply cancel any character translation. This is not a problem for greek users since Atari never established an official greek character set. After all the adopted standard of the MSDOS greek codepage is dead anyway, so the change won't hurt you.

I'll send the two patches by mail, but I post this answer just in case someone else is at a similar condition.

Het probleem met CAB had ik al eerder eens aangesneden - ik ben het zelf ook tegengekomen voor wat betreft ISO-8859-2. Het ligt voor de hand dat anderen - met andere ISO-standaarden als 8859-3 [Esperanto] of 8859-5 [Cyrillisch] - hier ook tegen aan zouden lopen. De 'patches' voor NVDI en CAB waren nieuw voor me en intrigeerden.

Ondertussen was ik op zoek naar Griekse homepages - wat nog niet eens zo eenvoudig is omdat alles wat je via een [westerse] zoekmachine opspoort over het algemeen gesteld zal zijn in het Engels, Frans of Duits. Via de zoekmachines - Yahoo, Alta Vista e.d. - kwam ik niet ver. Op de gok wetend dat het Griekse standaardisatie instituut - vergelijk het met het Nederlandse NNi - in het Grieks de afkorting 'ELOT' heeft kreeg ik toch een 'echt Griekse' tekst te pakken. De truc die ik voor ISO-8859-2 kon uithalen - er zijn maar relatief weinig tekens anders in ISO-8859-2 dan in ISO-8859-1 - zou voor het Grieks [of het Russisch] niet opgaan vanwege het totaal anders zijn dan ISO Latin 1.


Ik besloot er maar een paar e-mailtjes aan te wagen. Aan George Tompaz:

To: gtompazi@otenet.gr

Dear George,

I happened to stumble upon a discussion you had about Greek homepages. I was having similar problems reading Polish texts [ISO-8859-2] but managed to solve it. Looking in to the 'Greek problem' [reading the ELOT homepages] I came to the conclusion that there should be a more structural way - no patches as Panayiotis suggests although it's always better than nothing - so I wrote a letter to Alexander Clauss [see below]. Could you send me the e-mail address of Panayiotis so I can send him the same letter as well?

Best wishes, and a Happy New Year 1998, Rein

En ook één aan Alexander Clauss:

To: aclauss <aclauss@rbg.informatik.tu-darmstadt.de>

Dear Alexander

Thank you very much for your suggestion to replace the '&quot;' by '"'. It did help indeed. I'm still surprised how you managed to get such a wonderful browser available for the Atari community. Thank you for that too!!

I have to read a lot of Polish homepages in the original versions - either according to Windows 1250 or to ISO-8859-2. There is no way to read them directly - that is without a special mapping for NVDI. The straight mapping of the Polish character onto the ISO 8859-2 positions in the spdchar.map file didn't help me much either, since your programme performs a re-mapping [ISO-8859-1 to Atari]. I somehow managed to change the spdchar.map file so I can have ISO-8859-2 but no Windows 1250! I can thus read Polish homepages using CAB.


Lately I noticed several questions - both on the Internet as on Fidonet - about Greek. I was thinking about arranging a similar spdchar.map file for the Greek language but then realised that the Bitstream spd-fontfiles didn't contain the Greek characters [only a fistfull]. The Monotype ttf-files I have do contain all the Greek [and Cyrillic] characters I need [Arial, Times NewRoman, Courier New] but I don't know how to match them - if possible - via the spdchar.map file.

In Papyrus 5, I can import whatever language files I want, using their *.map files [Belegung-folder] and so choose ISO-8859-2 or Windows 1250 or - in case of Greek - Windows 1253 or ISO-8859-7. Saving a Greek html-file in CAB - I can't read it in CAB - I can later import it in Papyrus 5 [using the right filters and the above mentioned ttf-fonts] and read it on screen or print it on paper. It's just that the httml-tags are still around! Getting rid of them should be possible by using yet another utility I hope.

Having gone through all this, I was just wandering why can't we use the Papyrus-import filters [or similar ones to speed up the CAB handling] letting CAB be steered by the hmtl-metatags like:

<meta http-equiv = "content-type" content = "text/html;charset = ISO-8859-2"> ?

Default can be ISO-8859-1, and you don't have to worry about the funny Atari-belegung with its Hebrew characters on unconventional positions anymore!

I know it's only a temporary solution - as long as we're not adopting the 16-bits Unicode [or ISO-10646]. Thus we can have a 8-bits coding, using the ISO-8859-x and Windows 125x filters, and have access to Western European, Scandinavian, Eastern European, Greek and Hebrew homepages on our Atari machines.


Vanuit Griekenland wacht ik nog steeds op een reactie, vanuit Duitsland werd snel gereageerd:

Message-Id: <199712282241.XAA20741@rs2.hrz.tu-darmstadt.de>
Subject: Re: AtariGreek
Date: Son, 28 Dez 97 23:42:34 +0100
x-sender: aclauss@mail.rbg.informatik.tu-darmstadt.de
x-mailer: Claris Emailer 1.1
From: aclauss <aclauss@rbg.informatik.tu-darmstadt.de>
To: <dziewon@xs4all.nl>
Mime-Version: 1.0
Content-Type: text/plain; charset="US-ASCII"
X-UIDL: e5a31f6ff987da32134572b2e9b3f3a5
Status: N

>Windows 1250 or to ISO-8859-2. There is no way to read them directly -
>that is without a special mapping for NVDI. The straight mapping of the Polish character
>onto the ISO

Yes, I know of this problem. I'll try to find a solution, but unfortunately TOS doesn't support different character sets, so it will be much work.

-
Alex
.

Helaas was dit niet echt de reactie waar ik op had zitten wachten!


Copyright © Rein Bakhuizen van den Brink
Last updated on 26 december 2000

Home ISO 8859 ISO-8859-5 Unicode