Home Hypertekst en andere documentatie-tools ST Applications - de eerste STAP CAB

UDO

Voor mij hebben zowel CAB als ST-Guide duidelijke voordelen. En om van beide walletjes te kunnen mee-eten is een programma als UDO een uitkomst. Kennelijk zaten anderen met vergelijkbare problemen want met UDO [Universal DOcument] heeft Dirk Hagedorn conversieslagen gemaakt van uit het UDO-formaat naar ondermeer TEX, ST-Guide, HTML, RTF, en ASCII.

Het programma zelf biedt niet veel meer dan het kiezen van een bron en een doel-tekst, het soort doel, en nog een paar instellingen.

Het belangrijkste zijn de opmaak-instructies die lijken op die van HTML, ST-Guide en TEX doch uiteraard net iets anders. Niet alle instructies van de afzonderlijke programma's zijn vergelijkbaar, daarom worden in UDO soms originele instructies door een !raw [stg] of !raw [tex] code voorafgegaan.

De teksten van de eerste font avond/turen had ik al omgewerkt tot een STG-file maar nu ook tot een UDO-file. Vanuit de UDO-file pas ik het verhaal steeds aan, onder toevoeging van de latere afleveringen en het door elkaar schudden van alles. UDO testte ik door het font-verhaal zowel richting STG als HTM te laten gaan. Ten behoeve van het laatste is het echt nodig om - ik herhaal het nogmaal - per tekstenbundel een aparte folder te maken waarin ook de overeenkomstige GIF'jes als illustraties.

UDO is nu in versie 6 [patchlevel 12] verkrijgbaar, zowel in het Duits als in het Engels. Direct te downloaden bij de programmeur. Registratiekosten ook rechtstreeks met de programmeur Dirk Hagedorn afhandelen.


Als het geld bij Dirk aangekomen is stuurt hij je per brief een [voldane] rekening en een Key vermoedelijk gebaseerd op naam+adres-gegevens.

Onder gebruikmaking van mijn eigen Poolse standaard - ondersteund door een SPDCHAR.map - kon ik Poolse teksten rustig ST-Guide files binnenloodsen. Dezelfde *.U file met UDO gebruikend ten behoeve van een HTML-file gaf problemen binnen CAB. Na het probleem van de Poolse Internet-teksten te hebben opgelost - zie aldaar - dacht ik dus ook zelf Poolse teksten gecodeerd volgens ISO-8859-2 via UDO te kunnen verwerken. Tot mijn verbazing bleek dit keer UDO een spelbreker te zijn. Afhankelijk van de instructies code_ werden de codes veranderd al of niet genoteerd met een &..; .

Zonder enige code_ instructie:

173 => ¡
146 => Æ
194 => æ
156 => £
165 => Ñ
203 => Æ
124 => |
170 => ¬
255 => ¯
241 => ±
145 => æ
136 => ê
254 => ³
164 => ñ
162 => ó
188 => ¶
172 => ¼
168 => ¿


De andere instructies gaven deels afwijkende vertalingen. Daar ga je dan met je goede fatsoen. Nu vertelde Dirk Hagedorn in zijn documentatie wel dat hij intern codes vertaalde naar ISO-8859-1, dus stiekem was het eigenlijk niet maar wel erg lastig.

Om hier uit te komen was de enige oplossing om Poolse teksten - gecodeerd volgens ISO-8859-2 via een !rinclude opdracht als externe file binnen te voeren, waarbij de r van rinclude staat voor raw dus alles wordt zondermeer geaccepteerd. Prachtig zolang er geen formattering van de tekst nodig is zoals een simpele indeling in alinea's. Want UDO-instructies ertussenin geplaatst worden dan niet meer als instructies gezien. Wat wel kan is het plaatsen van HTML-instructies want die laat UDO ongemoeid en worden wel door CAB uitgevoerd.

Kortom, nogal onbevredigend. Ik ben met Dirk hierover in discussie gegaan en kreeg goede hoop dat hij een schakelaar zou inbouwen die alles onveranderd laat. Want het zijn niet alleen de Poolse tekens die de mist in gaan, maar ook de < en > tekens die voor HTML onmisbaar zijn worden omgezet naar &lt; en &gt;.


Het voorlaatste bericht was:

From: DirkHage@aol.com

Date: Wed, 26 Mar 1997 01:15:08 -0500 (EST)
Message-ID: <970326011506_-603154998@emout04.mail.aol.com>
To: dziewon@xs4all.nl
Subject: Re: UDO6-Polish

Hi Rein,

> I have made  four GIF's in papyrus using the Times New Roman
> TrueType fontfile that has most characters of ISO 1, 2, 5 and 7!

Thanks a lot!!!

> Somehow I think we're complicating the matter more than necessary.

UDO6 PL2 will support a new command called !html_ignore_8bit. If this
switch is used inside the preamble UDO will not quote the 8 bit characters,
only 7 bit characters will be adjusted (& to &amp; etc). OK?

PL2 is coming this or next week.

Ciao, Dirk

Niet veel later, in de wijzigingstekst bij Patchlevel 2 van 27 maart 1997 bleek dat het verzoek was ingewilligd:

Neu: Schalter !html_ignore_8bit

Wird dieser Schalter im Vorspann angegeben,
so werden 8-Bit Zeichen nicht in HTML-W
Entities (&auml; etc.) umgewandelt
[Rein Bakhuizen van den Brink].
Somit ist es moeglich, auch von ISO-Latin 1
abweichende Dateien zu erzeugen,
ohne das UDO dazwischenfunkt.


Copyright © Rein Bakhuizen van den Brink
Last updated on 26 december 2000

Home Hypertekst en andere documentatie-tools ST Applications - de eerste STAP CAB