Autor: Tomasz Kłoczko (kloczek_at_rudy.mif.pg.gda.pl)
Data: Mon 15 Jul 1996 - 16:28:55 MET DST
W piątek wysłałem list, na kilka grup pl.*, którego treść powinna moim
zdaniem dotrzeć także do sznownych polipowiczów. Dyskusja nad jego treścia
jest już dość mocno zaawansowana. Ze względu na to iż wiele zagadnień
poruszonych poniżej jest nadal nierozwiązanych baż niejasnych, osmielam się
zwiekszyć krąg ludzi do których ten list ma dotrzeć. Niemniej ze względu na
typowo "narodowy" temat zwracam się z prośba o nie omawianie jego treści na
tej grupie tylko na pl.comp.ogonki.
A oto i ten list:
---------------------------------------------------------------------------
Witojcie!
Dość.
Panowie szlachta .. wychodzimy na podwórko, bierzemy kamienie i walimy
po oknach.
Od pewnego czasu toczy się co raz gorętsza dyskusja nt kłopotów z polskimi
literami. Główne place boju są na terenach www, poczty, news-ów. Dodam tutaj
jeszcze kilka, ale o tym póżniej.
Chodzi o to, że standardem polskich znaków w Internecie jest ISO-8859-2, ale
okazuje się że my sami (użytkownicy) tegoż jakoś nie chcemy się przystosować
do niego, bo najlepiej byśmy się do niczego nie przystosowywali (nawet do
CePa1250).
***************************************************************************
Stan taki zapewne będzie miał miejsce jeszcze dość długo o ile nie
podejmiemy wszyscy zbiorowego wysiłku zmienienia tej sytuacji, tzn. nie
zaczniemy konsekwentnie używac tegoż standardu (ISO) na codzień i to
WSZĘDZIE (w poczcie, news-ach, www, dokumentach w sgml, TeX-u, LaTeX-u, w
irc-u i innychmożliwych miejscach).
***************************************************************************
List ten kieruję jednocześnie na kilka grup :), gdyż dotyczyć bedzie on
tematów poruszanych własnie na tych grupach. Osoby odpwiadające na mój list
publicznie, proszone są o sprawdzenie czy po wycieciu niepotrzebnych części
treści listu przedmówcy jest on odsyłany na właściwe grupę :-).
Poniższa treść powinna być kawałkami rozpatrzona, przedyskutowana,
"zjechana" (niepotrzebne skreślić) na poszczególnych grupach.
Poniższa treść zawiera zarówno podsumowanie dotychczasowej wiedzy jak i
porusza tematy dotąd mało rozpracowane, eksploatowane.
List jest dość długi, wiec przeplotłem go drobnymi :-) przerywnikami.
------------------------- pl.comp.ogonki ----------------------------------
Piszę czasami bardzo nieortograficznie i nie mam zamiaru dłużej doprowadzać
do zawałów osób czytających moje listy z powodu kardynalnych błędów
ortograficznych. W związku z tym mam pytanie jak wygląda sprawa polskiego
słownika pod ispell-a?
------------------------- pl.rec.rowery ----------------------------------
W razie gdyby któryś z niezdecydowanych użytkowników Ł'95 (ŁYNDOŁS) chciał
przejechac rowerem przez okno to ... stanowczo odradzam, grozi to poważnymi
konsekwencjami, także w przypadku gdy okno jest już otwarte.
Czy ktoś zna przypadki wyjazdów rowerem przez okno bez poważnych
konsekwencji zdrowotnych (umyslowych i fizycznych) ?
------------------------- pl.comp.www ------------------------------------
W zasadzie zostało już ustalone co powinna zawierac stona w html-u, żeby
mogla być poprawnie zidentyfikowana jako taka, która zawiera treści w
ISO-8859-2. Oto przyklad (pobrany żywcem z wczesniejszej dyskusji):
<HTML>
<meta http-equiv="content-type" content="text/html; charset=iso-8859-2">
<HEAD>
<TITLE>IMMT</TITLE>
</HEAD>
<body>
bla bla bla z polskimi literkami
</body>
Moje pytania:
o Czy posługując się powyższym przykładem jest możliwe spreparowanie
strony zawierajacej części w różnych charset ?
o Jak wygląda sytuacja z wypuszczanymi obecnie na rynek przegladarkami
(starymi nie warto się przejmować) jeśli chodzi o poprawne rozpoznawanie
powyższego schematu ? W przypadku gdyby jakiś prducent nie
stosował się do powyższego, mam prośbę do ludzi z PSI, PLUG i innych
tego typu organizacji, o wystosowanie oficjalnego żadania, prośby,
błagania (niepotrzebne skreślić) o podporządkowanie się do powyższego.
W razie gdyby był to program free i w zródłach, prośba o wymienienie
takich z dodatkowa informacją o namiarach na źródła w celu zanęcenia
rodzimych grzebaczy w źródlach mogących zmienić ten zły stan. W razie
braku argumentów na komercyjnych może bedzie konieczne zbieranie
podpisów, głosów użytkowników.
Źródła do Mosaic-a leża u mnie (jeszcze go pod kątem "polskim" nie
sprawdazłem):
ftp://ftp.pg.gda.pl/pub/OS/Linux/xtras-PG/kloczek/source
Powyższy punkt będzie także dotyczył wszelkiego rodzaju edytorów html
które, po zaistnieniu odpowiedniego meta w dokumencie powinny
automatycznie właczyć przekodowywanie znaków w edytowanym dokumencie, a
w razie gdyby to był edytor win* to powinien na ekranie dalej używac
fontow w CePie, a w pliku znaków w ISO. Dzięki temu odpadną wszelkie
problemy ludzi zajmujących się tworzeniem stron www, a używajacych do
tego celu (tfu) win*.
Jako poprawną sytuację koncową uznałbym taka, w której przy wystąpiewniu
odpowiedniego meta w dokumencie, spowodowałoby to przełączenie zestawu
fontów w przeglądarce bez uciekania się do ręcznego porzestawiania jakiś
paramertów w samej przeglądarce.
------------------------- pl.rec.muzyka ----------------------------------
Proponuję uczcić minutą ciszy tych wszystkich muzyków, któży w sytuacji
braku weny twórczej rzucili się przez okno.
------------------------- pl.comp.sys.pc-unix.linux i pl.comp.sys.pc-unix-
Tutaj też jest troche do zrobienia, chodz sytuacja wygląda coraz lepiej.
Można to zmienić radykalnie (i to dość szybko) poprzez odwolywanie sie do
administratorów U*nix-owych serwerów z prośba o zmienienie konfiguraji
**domyślnej** wszystkich narzędzi, które tego będą wymagać.
o W najbliższym czasie wypadałoby przejrzeć jeszcze raz wszystkie możliwe
pakiety podejrzane o brużdżenie w temacie ogonków i wzbogacienie,
zmodyfikowanie ich konfiguracji, z uzględnieniem ich
możliwości związanych z wyswietlaniem znaków o kodach > 128. I tak:
x Edytory:
- vi, vim, pico - tutaj nic nie trzreba zmieniać, przyjmują kody
powyżej 128 i nie mają z nimi klopotów.
- joe - drobnej modyfikacji wymagaja pliki konfiguracyjne. Polegać
ma to na wykasowaniu spacji na poczatku linijki:
-asis Characters 128 - 255 shown as-is
Proszę pamiętać, że pakiet joe to często kilka edytorów i trzeba w
powyższy sposów zmodyfikowac następujące pliki: jmacsrc, joerc,
jpicorc, jstarrc, rjoerc (pliki te znajduja się zazwyczaj w
/usr/lib/joe lub /usr/local/lib/joe).
Może ktoś ma spolszczonego help-a do joe?
- emacs - patrz http://www.agh.edu.pl/ogonki/emacs.html. Jest Polski
help do emacs-a?
- jed - używać wersji >= 0.F97.14, w której została dodana
odpowiednia modyfikacja zrobiona przez Adama Tlałkę
(atlka_at_pg.gda.pl) umożliwiająca bezkolizyjne kożystanie z ISO.
- jove - ?????
- inne - ?????
x News reader-y i mailer-y:
Tutaj sytuacja wygląda tak, że prawidłowy list ze znakami w
ISO-8859-2 powinien zawierać w nagłówku fragment:
Content-Type: text/plain; charset="iso-8859-2"
Content-transfer-encoding: quoted-printable
Choć zauważyłem, że na news-ach ci co używają polskich literek
cześciej mają:
Content-transfer-encoding: 8-bit
Content-Type: text/plain; charset="iso-8859-2"
To ograniczenie do quoted-printable ma być z uwagi na to, że
niektóre mail daemon-y przy odbieraniu listu czyszcza ósmy bit,
a same znaki o kodach > 128 beda przekodowywane na "bezpiczne"
siedmio bitowe.
- tin - z tego co wiem to na razie nie ma sposobu na to żeby zmusić
go do poprawnego prepatowania nagłówka (sprubuję też sam zajrzeć
do źrodeł). Z tego powodu chwilowo sam bedę musiał się przestawić
na slrn-a.
- slrn - w pliku slrn.rc trzeba zmienić linijkę z:
set mime_charset "iso-8859-1"
na:
set mime_charset "iso-8859-2"
Po tej modyfikacji w przypadku wystąpienia w liście znaków o
kodach > 128 automatycznie jest dodawana wcześniej cytowana
modyfikacja nagłówka listu. Modyfikacje można wykonać oczywiście
też w lokalnym pliku konfiguracyjnym.
- pine - tutaj też trzeba zmienić plik konfiguracyjny pine.conf,
który znajduje się w /usr/local/lib lub /usr/lib. Zmienić trzeba:
character-set=
na:
character-set=ISO-8859-2
Powyższa modyfikacje można sobie wykonać z poziomu samej aplikacji
(ale tylko lokalnie do ~/.pinerc). Main menu/Setup/Config, jest
tam linijka "character-set=", w ktorej trzeba dodać (klawisz "a")
tekst ISO-8859-2.
- nn - ?????
- cnews - ????
- inn - ?????
- elm - nie używam więc nie wiem.
- standardowy mail, Mail - ?????.
- inne - ?????.
x Pager-y
- less - trzeba mu zasygnalizować żeby wyświetlał znaki o kodach
powyżej 128. Trzeba ustawić w środowisku zmienną
LESSCHARSET na latin1.
- most - nie uzywam i nie wiem.
- inne - ???
x Shell-e
- sh - nie używam "czystego" sh więc nie wiem. Pod Linux-em jest to
to samo co bash.
- bash - używa przy wprowaczaniu znaków do lini poleceń funkcji z
libreadline. Biblioteka ta uzywa pliku konfiguracyjnego ~/.inputrc
i nie ma pliku globalnego (??, moze trzeba to zmienic lub na
potrzeby polskie zmienic domyślne ustawienia w źródłach?). W pliku
konfiguracyjnym powinny być trzy linijki:
set meta-flag on
set convert-meta off
set output-meta on
Po czym możemy już swobodnie robić takie rzeczy jak
> mkdir bździągwa
- csh, tcsh - po mimo, że sam używam tcsh to jeszcze nie mam
przepisu.
- ash - ???
- zsh - ???
- inne - ???
x Procesory tekstu
- TeX, LaTeX - nie używam, proszę o uzupełnienie, ale takie które
będzie zgodne z ISO (nie sekwencje znaków). Czy Isnieje możliwość
w dokumencie *TeX-owym zaznaczenia, że jest on w ISO-8859-2. Czy
istnieje potrzeba dostosowywania obecnych rozwiązan do wymogów
ISO?
x Inne
- ls (color) - żeby wyświetlał pliki, które w nazwach mają polskie
znaki trzeba trzeba w /etc/DIR_COLORS dodac:
EIGHTBIT yes
OPTIONS -N
po czym trzeba wywołać:
eval `dircolors`
w celu utworzenia odpowiednich aliasów. Wskazane byłyby
odpowiednie modyfikacje w /etc/profile i /etc/csh.cshrc
- mc - tutaj nie wiem, ale z tego co rozmawialem z Adamem Tlałką
wymagać to bedzie jeszcze drobnych zmian w samym mc.
- allegro - nie uzywam wiec nie wiem.
- IRC - wymagany IRC-II, w pliku /usr/lib/irc/script/global lub
/usr/local/lib/irc/script/global trzeba dodać linijki:
set translation latin_1
set eight_bit_characters on
To samo może sobie zrobic każdy użytkownik na własna rękę
wstawiajac powyższe w ~/.ircrc (X-y).
Co z innymi klientami IRC-a ?
- inne - ????
o fonty konsolowe do Linux-a:
Tutaj jest pakiet Adama Tlałki:
ftp://ftp.pg.gda.pl/pub/OS/Linux/util/system/iso02console.tgz
W obecnej wersji nie zawiera jeszcze poprawek do nowego Init-a (choc
na stronie ogonkowej potrzebne informacje sa juz umieszczone).
Działa poprawnie (sam z niego w tej chwili kozystam). Jedyna wada w
obecnej chwili jest to, ze jest wyposazony w tylko jeden font.
Chetni do robienia fontow pod konsole proszeni sa o kontakt z Adamem
(atlka_at_pg.gda.pl). Istnieje w ramach nowych mozliwosci jakie daja
nowe kernel-e zrobienie fonfu z definicja 512 znakow (tez odsylam do
Adama).
W najbliższym czasie postaram się uzupełnić to co już wiadomo o
namiary na edytory do fontów (chyba widziałem jakiegoś rpm-a).
Żeby zachować standard rozkładu wzorców czcionek w pliku fontu
zalecane jest zajrzenie do fontu jaki jest w pakiecie Adama, a w
razie innych pomysłów prosze o kontak z nim.
Powyższe zalecenia sformułowalem na podstawie doswiadczeń z Linux-em.
o X-y
x Aplikacje - Nie jestem za dobrze zorientowany w temacie ale czy po
ustawieniu odpowiednich zmiennych (LANG, LC_CTYPE ..) jest możliwe
automatyczne wybieranie różych (zlokalizowanych) app-defaults
zasobów danej aplikacji (a może to inaczej się ma odbywać). Z tego
co widzialem to w ramach dystrybucji źródeł asEdit ma wpełni
spolonizowane zasoby. Zapewne inne aplikacje mają też spolnizowane
zasoby (które?), może ktoś ma app-defauts do Netscape?
x Fonty w ISO-8859-2
W tej chwili są dostępne różnej jakości fonty w formatach bdf, pcf.
Są to fonty rastrowe i stąd zapewne min. tytuł jednego z wątków na
którym toczyla się ostra dyskusja, która się zaczeła od tego że
fonty pod X-y są kiepsdkiej jakości (niestety, ale w tylko rastrowe).
Fonty w formacie bdf, pcf należy uznać za przejściowe i ostatecznie
powinnismy dążyć do tego żeby we wszystkich dystrybucjach Linux-a
znalazły sie fonty w formacie pfa, pfb (wektorowe). Courier (pfb)
gdzieś sie wala (widziałem, że Adam Tlałka mial). Niemniej nadal
jest tego mało. Z wykożystaniem Mac-a probóje zrobić jeszcze kilka
ale idzie mi to opornie. Zdaje sie, że ten Courier był udostepniony
free przez IBM, może jest tego więcej.
Lista zasobów z fontami jest na stronie ogonkowej.
Moge ja uzupełnić o zasoby pod RedHat-a w postaci rpm-a:
ftp://ftp.pg.gda.pl/pub/OS/Linux/xtras-PG/kloczek/RPMS/
Czy ktoś wie jak wygląda sprawa z UNICODE i XFree ? Gdzieś są
żródła uxterm-a (Unicode Xterm). Zapewne zachacze o nie w
najbliższym czasie.
o Inne U*nix-y nix Linux
Jak wygląda sytuacja na innych U*nix-ach ? Może jakieś szczegółowe
rady dla tych co jeszcze nie wiedzą co i jak zrobić ?
Po przedyskutowaniu i uzupelnieniu zapewne możnaby to co z tego powstanie
dołaczyć do info na stronie ogonkowej i w Polish_HOWTO.
------------------------- pl.irc -----------------------------------------
Od dzisiaj nie ma juz lamer-ów, są tylko łamagi :-).
------------------------- pl.comp.pecet ----------------------------------
Klient ssh na OS/2 wymaga dopracowania tak żeby był w stanie wyświetlać
polskie litery. Informacje o telbinie umożliwające prace z ISO na terminalu
pod Dos-em są na stronie ogonkowej.
------------------------- pl.rec.film ------------------------------------
Ogłaszam konkurs na tytuły filmów z "oknem" w tytule (moga być nie polskie).
Poszukiwane są w kategoriach: horr, tasiemc serialowy, dramat
psychologiczy. Ostatnio w TV byla "Panienka z okienka", ale to był bajka
więc się nie liczy.
--------------------------------------------------------------------------
Od dzisiaj bedę wytykał wsystkim na new-ach i w poczcie prywatnej,
publicznej brak polskich liter :-).
Mam nadzieje, że nie zanudziłem na śmierć, a i dyskusja bedzie w tym wypadku
wyjątkowo rzeczowa i owocna.
Pozdrawiam
kloczek
PS. Spolszczyłem sygnature i od dziasiaj używam polskich liter. Choć
przestawienie się na język ojczysty idzie mi cieżko. Kto
nastepny?
-----------------------------------------------------------
"Ludzie nie maja problemów, tylko sobie sami je stwarzają"
-----------------------------------------------------------
Tomasz Kłoczko, student, PG FTiMS | e-mail : kloczek_at_rudy.mif.pg.gda.pl
To archiwum zostało wygenerowane przez hypermail 2.1.7 : Wed 19 May 2004 - 15:58:26 MET DST