Home Papyrus M$ Word en HTML Papyrus - RTF bullets

M$ Word -> Papyrus

Conversions from M$ Word to Papyrus

It is assumed that you should have Papyrus version 4.09 and onwards - preferably 7 - but any demo version will do. Also necessary is NVDI 4 or 5 + practically any Bitstream Speedo font [file extension: spd] installed [or TrueType fonts like Arial of Times New Roman that originate from a multilingual Windows 95/98 set-up, you can tell by the files-size: circa 140k or more, not below 100k anyway]. System enhancements like Polfont are not necessary - might be contraproductive. Also the Spdchar.map mapping file is not necessary.

The Papyrus folders should have a 'Belegung' folder containing several map-files - among them Win1250.map and ISO88592.map - that can be edited like ascii-files. If you haven't you'll find the ascii-texts below. In the papyrus settings ('Einstellungen') you should have the 'compatibility' on 'Unicode' [not 'Atari Belegung']. Depending on what sort of text-file should be converted use the set-up options for 'ASCII' and 'RTF'. So far the options for 'HTM' are useless. After importing the text may not look good but that is because you still might may to 'select all' and choose the right font [no Monaco, no Atari system-font]. Also have a look at RTF -> Papyrus !

Konwersja z M$ Word'a na Papyrus

Potrzebny jest program papyrus wersja 4.09 lub wyżej - najlepiej 7 - ale wersja demo wystarczy. Też potrzebne są NVDI 4 lub 5 + praktycznie każdy Bitstream Speedo font [ekstensja pliku: spd] zainstalowany [może też fonty TrueType takie jak Arial czy Times New Roman z pochodzenia wielojęzycznego Windows 95/98, wielkość pliku musi być około 140k albo więcej, nie mniej niż 100k]. Dodatki systemowe takie jak Polfont są niepotrzebne a raczej szkodliwe. Również nie potrzebny jest plik mapingowy: spdchar.map.

Papyrus musi mieć folder 'Belegung' z plikami mapingowe - bynajmniej 'Win1250.map' i 'ISO88592.map'. Są to pliki tekstowe. Jak ich nie ma, patrz poniżej. W setingach papyrus'a ('Einstellungen') kompatibilność musi być na 'Unicode' [nie (!) 'Atari Belegung']. Zależnie od rodzaju pliku różne opcje dla 'ASCII' albo 'RTF'. Nie ma opcji dla 'HTM' . Jak po imporcie tekst nie dobrze wygląda jeszcze trzeba wybierać odpowiedny font [nie (!) Monaco,nie font Atari, itd]. Patrz też na RTF -> Papyrus !


Conversions

source M$ export papyrus import
M$ Word 6-7 *.doc not importable
*.rtf set RTF import on 'Win1250' [automatic fails]
*.asc, *.txt set ASCII import on 'WIn1250'
M$ Word 8 [98] *.doc not importable
*.rtf set RTF import on 'Win1250' [automatic fails]
*.asc, *.txt set ASCII import on 'Win1250'
*.unicode not importable
*.html no problems !
from the WWW *.htm [Win1250] remove HTML-tags in ascii-editor since papyrus assumes ISO 88591, set ASCII import accordingly
*.htm [Iso88592]

Konwersje

źródlo M$ eksport papyrus import
M$ Word 6-7 *.doc nie da się
*.rtf RTF import na 'Win1250' [nie może być automatycznie]
*.asc, *.txt ASCII import na 'WIn1250'
M$ Word 8 [97] *.doc nie da się
*.rtf RTF import na 'Win1250' [nie może być automatycznie]
*.asc, *.txt ASCII import na 'Win1250'
*.unicode nie da się
*.html [HTML4] żadnych problemów !
from the WWW *.htm [Win1250] usuń HTML-tag-i edytorem ponieważ papyrus widzi tylko iso 8859-1, ASCII import odpowiednio
*.htm [Iso88592]


The file-formats have changed between Word 7 and Word 8/98. The latter uses 16-bits instead of 8-bits. The Unicode export file is a stripped doc-file. You need separate conversion-programms [Robert Best of Leusden, Netherlands] is programming one.

When exporting from papyrus to ASCII or RTF use 'Win1250' in the set-up. Make sure the RTF-file contains '1250'.

Format pliku zmieniło się między Word 7 i Word 8/97. Word 97 używa kod 16-bitowy zamiast 8-bitowego. Plik eksportowy 'Unicode' jest plik doc-u bez niepotrzebnych rczeczy wewnętrznych. W tej chwili Robert Best w Leusden, Holandia projektuje program dla konwersji plików doc-u.

Eksportując z papyrus'a na RTF trzeba raczej używać opjcę 'Win1250'. Sprawdź czy jest tam w RTF-ie '1250'.


That's how the ogonki should be coded / Jak ogonki mają być zakodowane w różnych formatach:

Unicode
2-bytes hex Windows 1250 ISO Latin 2 HTML 4
cacute 07/01 107 e6 e6 263
lslash 42/01 142 b3 b3 322
nacute 44/01 144 f1 f1 324
sacute 5b/01 15b 9c b6 347
zacute 7a/01 17a 9f bc 378
zdot 7c/01 17c bf bf 380
aogonek 05/01 105 b9 b1 261
eogonek 19/01 119 ea ea 281
oacute f3/00 f3 f3 f3 243
Cacute 06/01 106 c6 c6 262
Lslash 41/01 141 a3 a3 321
Nacute 43/01 143 d1 d1 323
Sacute 5a/01 15a 8c a6 346
Zacute 79/01 179 8f ac 377
Zdot 7b/01 17b af af 379
Aogonek 04/01 104 a5 a1 260
Eogonek 18/01 118 ca ca 280
Oacute d3/00 d3 d3 d3 211


ISO88592.map

CHARSET-NAME=ISO 8859-2 (Latin-2, Eastern Europe)
CHARSET-NAME-GERMAN=ISO 8859-2 (Lateinisch 2, Osteuropa)
CODEPAGE-NUMBER=912
EXPLANATION=Suited for (at least) Albanian, Czech, Hungarian, Polish,
EXPLANATION=Rumanian, (Serbo-)Croatian, Slovak and Slovene.
#
# Characters 20-7F are identical to ASCII (ISO 646)
# Characters 80-9F are unassigned
UNICODE-MAP=
#      0    1    2    3    4    5    6    7    8    9    A    B    C    D    E    F
#    ==============================================================================
A0:   A0  104  2D8  141   A4  13D  15A   A7   A8  160  15E  164  179   AD  17D  17B
B0:   B0  105  2DB  142   B4  13E  15B  2C7   B8  161  15F  165  17A  2DD  17E  17C
C0:  154   C1   C2  102   C4  139  106   C7  10C   C9  118   CB  11A   CD   CE  10E
D0:  110  143  147   D3   D4  150   D6   D7  158  16E   DA  170   DC   DD  162   DF
E0:  155   E1   E2  103   E4  13A  107   E7  10D   E9  119   EB  11B   ED   EE  10F
F0:  111  144  148   F3   F4  151   F6   F7  159  16F   FA  171   FC   FD  163  2D9


Win1250.map

CHARSET-NAME=MS Windows Codepage 1250 (Eastern Europe)
CHARSET-NAME-GERMAN=MS Windows Codeseite 1250 (Osteuropa)
CODEPAGE-NUMBER=1250
EXPLANATION=looks like modified Version of ISO 8859-2
#
# Characters 20-7F are identical to ASCII (ISO 646)
UNICODE-MAP=
#      0    1    2    3    4    5    6    7    8    9    A    B    C    D    E    F
#    ==============================================================================
80:    *    * 201A    * 201E 2026 2020 2021    * 2030  160 2039  15A  164  17D  179
90:    * 2018 2019 201C 201D 2219 2013 2014    * 2122  161 203A  15B  165  17E  17A
A0:   A0  2C7  2D8  141   A4  104   A6   A7   A8   A9  15E   AB   AC   AD   AE  17B
B0:   B0   B1  2DB  142   B4   B5   B6   B7   B8  105  15F   BB  13E  2DD  13D  17C
C0:  154   C1   C2  102   C4  139  106   C7  10C   C9  118   CB  11A   CD   CE  10E
D0:  110  143  147   D3   D4  150   D6   D7  158  16E   DA  170   DC   DD  162   DF
E0:  155   E1   E2  103   E4  13A  107   E7  10D   E9  119   EB  11B   ED   EE  10F
F0:  111  144  148   F3   F4  151   F6   F7  159  16F   FA  171   FC   FD  163  2D9


Example of HTL-4 plus ogonki / Przykład HMTL-4-u z ogonkami

<HTML>
<HEAD>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=windows-1252">
<META NAME="Generator" CONTENT="Microsoft Word 97">
<TITLE>&#260;&#261;&#262;&#263;&#280;&#281;&#321;&#322;&#323;&#324;
&#346;&#347;&#377;&#378;&#379;&#380;</TITLE>
</HEAD>
<BODY>

<FONT SIZE=4>
<P>&nbsp;</P>
</FONT><FONT FACE="Times New Roman" SIZE=4>
<P>
&#260;&#261;&#262;&#263;&#280;&#281;&#321;&#322;&#323;&#324;
&#346;&#347;&#377;&#378;&#379;&#380;
</P>
</FONT>
</BODY>
</HTML>

Example of RTF plus ogonki / Przykład RTF-u z ogonkami

{\rtf1\ansi\ansicpg1250\uc1 \deff0\deflang1033\deflangfe1033{\fonttbl
{\f0\froman\fcharset0\fprq2{\*\panose 02020603050405020304}Times New Roman;}
{\f1\fswiss\fcharset0\fprq2{\*\panose 020b0604020202020204}Arial;}
{\f2\fmodern\fcharset0\fprq1{\*\panose 02070309020205020404}Courier New;}
{\f16\froman\fcharset238\fprq2 Times New Roman CE;}
{\f17\froman\fcharset204\fprq2 Times New Roman Cyr;}
{\f19\froman\fcharset161\fprq2 Times New Roman Greek;}
{\f20\froman\fcharset162\fprq2 Times New Roman Tur;}
{\f21\froman\fcharset186\fprq2 Times New Roman Baltic;}
{\f22\fswiss\fcharset238\fprq2 Arial CE;}
{\f23\fswiss\fcharset204\fprq2 Arial Cyr;}
{\f25\fswiss\fcharset161\fprq2 Arial Greek;}
{\f26\fswiss\fcharset162\fprq2 Arial Tur;}
{\f27\fswiss\fcharset186\fprq2 Arial Baltic;}
{\f28\fmodern\fcharset238\fprq1 Courier New CE;}
{\f29\fmodern\fcharset204\fprq1 Courier New Cyr;}
{\f31\fmodern\fcharset161\fprq1 Courier New Greek;}
{\f32\fmodern\fcharset162\fprq1 Courier New Tur;}
{\f33\fmodern\fcharset186\fprq1 Courier New Baltic;}}
{\f1 Krzysztof Daukszewicz \ldblquote Dobranoc Europo\rdblquote
\par
\par Dobranoc, Europo odpoczywaj
\par }{\f22 Tobie ju\'bf potrzebny sen                         }{\f1
\par Wszystkiego ci przybywa
\par }{\f22 Pracowity mia\'b3a\'9c dzie\'f1}{\f1
\par A my dopiero dzi}{\f22 \'9c budzimy si\'ea                   }{\f1
\par Przespali}{\f22 \'9c}{\f1 my tych szans i lat za wiele
\par }{\f22 I wreszcie przysz\'b3a pora wsta\'e6                  }{\f1
\par Dobranoc, Europo, moja Europo
\par Dobranoc, Europo ty id}{\f22 \'9f spa\'e6                    }{\f1
\par Dobranoc, Europo, moja Europo
\par Dobranoc, Europo ty id}{\f22 \'9f spa\'e6                    }{\f1
\par \par Tu nawet dzieci siedz}{\f22 \'b9}{\f1  na walizkach
\par }{\f22 By ruszy\'e6 w tw\'f3j wygodny \'9c}{\f1 wiat
\par }{\f22 Gdzie \'bfycia pe\'b3na miska
\par }{\f1 I nadzi}{\f22 eja t\'b3ustych lat
\par A do nas pierwszy promie\'f1 s\'b3o\'f1ca wpad\'b3
\par I g\'b3owy unosimy znad poduszek:
\par Czy wreszcie przysz\'b3a pora wsta\'e6?
\par }{\f1 Dobranoc, Europo, moja Europo
\par Dobranoc, Europo ty id}{\f22 \'9f spa\'e6
\par }{\f1 Dobranoc, Europo, moja Europo
\par Dobranoc, Europo ty id}{\f22 \'9f spa\'e6


Copyright © Rein Bakhuizen van den Brink
Last updated on 26 december 2000

Home Papyrus M$ Word en HTML Papyrus - RTF bullets