z kamieniem w ręku .. (fwd)

Autor: Tomasz Kłoczko (kloczek_at_rudy.mif.pg.gda.pl)
Data: Mon 15 Jul 1996 - 16:28:55 MET DST


W piątek wysłałem list, na kilka grup pl.*, którego treść powinna moim
zdaniem dotrzeć także do sznownych polipowiczów. Dyskusja nad jego treścia
jest już dość mocno zaawansowana. Ze względu na to iż wiele zagadnień
poruszonych poniżej jest nadal nierozwiązanych baż niejasnych, osmielam się
zwiekszyć krąg ludzi do których ten list ma dotrzeć. Niemniej ze względu na
typowo "narodowy" temat zwracam się z prośba o nie omawianie jego treści na
tej grupie tylko na pl.comp.ogonki.

A oto i ten list:
---------------------------------------------------------------------------

Witojcie!

Dość.
Panowie szlachta .. wychodzimy na podwórko, bierzemy kamienie i walimy
po oknach.
Od pewnego czasu toczy się co raz gorętsza dyskusja nt kłopotów z polskimi
literami. Główne place boju są na terenach www, poczty, news-ów. Dodam tutaj
jeszcze kilka, ale o tym póżniej.
Chodzi o to, że standardem polskich znaków w Internecie jest ISO-8859-2, ale
okazuje się że my sami (użytkownicy) tegoż jakoś nie chcemy się przystosować
do niego, bo najlepiej byśmy się do niczego nie przystosowywali (nawet do
CePa1250).

***************************************************************************
Stan taki zapewne będzie miał miejsce jeszcze dość długo o ile nie
podejmiemy wszyscy zbiorowego wysiłku zmienienia tej sytuacji, tzn. nie
zaczniemy konsekwentnie używac tegoż standardu (ISO) na codzień i to
WSZĘDZIE (w poczcie, news-ach, www, dokumentach w sgml, TeX-u, LaTeX-u, w
irc-u i innychmożliwych miejscach).
***************************************************************************

List ten kieruję jednocześnie na kilka grup :), gdyż dotyczyć bedzie on
tematów poruszanych własnie na tych grupach. Osoby odpwiadające na mój list
publicznie, proszone są o sprawdzenie czy po wycieciu niepotrzebnych części
treści listu przedmówcy jest on odsyłany na właściwe grupę :-).

Poniższa treść powinna być kawałkami rozpatrzona, przedyskutowana,
"zjechana" (niepotrzebne skreślić) na poszczególnych grupach.
Poniższa treść zawiera zarówno podsumowanie dotychczasowej wiedzy jak i
porusza tematy dotąd mało rozpracowane, eksploatowane.

List jest dość długi, wiec przeplotłem go drobnymi :-) przerywnikami.

------------------------- pl.comp.ogonki ----------------------------------

Piszę czasami bardzo nieortograficznie i nie mam zamiaru dłużej doprowadzać
do zawałów osób czytających moje listy z powodu kardynalnych błędów
ortograficznych. W związku z tym mam pytanie jak wygląda sprawa polskiego
słownika pod ispell-a?

------------------------- pl.rec.rowery ----------------------------------

W razie gdyby któryś z niezdecydowanych użytkowników Ł'95 (ŁYNDOŁS) chciał
przejechac rowerem przez okno to ... stanowczo odradzam, grozi to poważnymi
konsekwencjami, także w przypadku gdy okno jest już otwarte.

Czy ktoś zna przypadki wyjazdów rowerem przez okno bez poważnych
konsekwencji zdrowotnych (umyslowych i fizycznych) ?

------------------------- pl.comp.www ------------------------------------

W zasadzie zostało już ustalone co powinna zawierac stona w html-u, żeby
mogla być poprawnie zidentyfikowana jako taka, która zawiera treści w
ISO-8859-2. Oto przyklad (pobrany żywcem z wczesniejszej dyskusji):

<HTML>
<meta http-equiv="content-type" content="text/html; charset=iso-8859-2">
<HEAD>
<TITLE>IMMT</TITLE>
</HEAD>
<body>
bla bla bla z polskimi literkami
</body>

Moje pytania:
  o Czy posługując się powyższym przykładem jest możliwe spreparowanie
    strony zawierajacej części w różnych charset ?
  o Jak wygląda sytuacja z wypuszczanymi obecnie na rynek przegladarkami
    (starymi nie warto się przejmować) jeśli chodzi o poprawne rozpoznawanie
    powyższego schematu ? W przypadku gdyby jakiś prducent nie
    stosował się do powyższego, mam prośbę do ludzi z PSI, PLUG i innych
    tego typu organizacji, o wystosowanie oficjalnego żadania, prośby,
    błagania (niepotrzebne skreślić) o podporządkowanie się do powyższego.
    W razie gdyby był to program free i w zródłach, prośba o wymienienie
    takich z dodatkowa informacją o namiarach na źródła w celu zanęcenia
    rodzimych grzebaczy w źródlach mogących zmienić ten zły stan. W razie
    braku argumentów na komercyjnych może bedzie konieczne zbieranie
    podpisów, głosów użytkowników.

    Źródła do Mosaic-a leża u mnie (jeszcze go pod kątem "polskim" nie
    sprawdazłem):
    ftp://ftp.pg.gda.pl/pub/OS/Linux/xtras-PG/kloczek/source

    Powyższy punkt będzie także dotyczył wszelkiego rodzaju edytorów html
    które, po zaistnieniu odpowiedniego meta w dokumencie powinny
    automatycznie właczyć przekodowywanie znaków w edytowanym dokumencie, a
    w razie gdyby to był edytor win* to powinien na ekranie dalej używac
    fontow w CePie, a w pliku znaków w ISO. Dzięki temu odpadną wszelkie
    problemy ludzi zajmujących się tworzeniem stron www, a używajacych do
    tego celu (tfu) win*.

Jako poprawną sytuację koncową uznałbym taka, w której przy wystąpiewniu
odpowiedniego meta w dokumencie, spowodowałoby to przełączenie zestawu
fontów w przeglądarce bez uciekania się do ręcznego porzestawiania jakiś
paramertów w samej przeglądarce.

------------------------- pl.rec.muzyka ----------------------------------

Proponuję uczcić minutą ciszy tych wszystkich muzyków, któży w sytuacji
braku weny twórczej rzucili się przez okno.

------------------------- pl.comp.sys.pc-unix.linux i pl.comp.sys.pc-unix-

Tutaj też jest troche do zrobienia, chodz sytuacja wygląda coraz lepiej.
Można to zmienić radykalnie (i to dość szybko) poprzez odwolywanie sie do
administratorów U*nix-owych serwerów z prośba o zmienienie konfiguraji
**domyślnej** wszystkich narzędzi, które tego będą wymagać.

   o W najbliższym czasie wypadałoby przejrzeć jeszcze raz wszystkie możliwe
     pakiety podejrzane o brużdżenie w temacie ogonków i wzbogacienie,
     zmodyfikowanie ich konfiguracji, z uzględnieniem ich
     możliwości związanych z wyswietlaniem znaków o kodach > 128. I tak:

     x Edytory:
        - vi, vim, pico - tutaj nic nie trzreba zmieniać, przyjmują kody
          powyżej 128 i nie mają z nimi klopotów.
        - joe - drobnej modyfikacji wymagaja pliki konfiguracyjne. Polegać
          ma to na wykasowaniu spacji na poczatku linijki:

-asis Characters 128 - 255 shown as-is

         Proszę pamiętać, że pakiet joe to często kilka edytorów i trzeba w
         powyższy sposów zmodyfikowac następujące pliki: jmacsrc, joerc,
         jpicorc, jstarrc, rjoerc (pliki te znajduja się zazwyczaj w
         /usr/lib/joe lub /usr/local/lib/joe).
         Może ktoś ma spolszczonego help-a do joe?
        - emacs - patrz http://www.agh.edu.pl/ogonki/emacs.html. Jest Polski
          help do emacs-a?
        - jed - używać wersji >= 0.F97.14, w której została dodana
          odpowiednia modyfikacja zrobiona przez Adama Tlałkę
          (atlka_at_pg.gda.pl) umożliwiająca bezkolizyjne kożystanie z ISO.
        - jove - ?????
        - inne - ?????

     x News reader-y i mailer-y:
        Tutaj sytuacja wygląda tak, że prawidłowy list ze znakami w
        ISO-8859-2 powinien zawierać w nagłówku fragment:

Content-Type: text/plain; charset="iso-8859-2"
Content-transfer-encoding: quoted-printable
        Choć zauważyłem, że na news-ach ci co używają polskich literek
        cześciej mają:
Content-transfer-encoding: 8-bit
Content-Type: text/plain; charset="iso-8859-2"

        To ograniczenie do quoted-printable ma być z uwagi na to, że
        niektóre mail daemon-y przy odbieraniu listu czyszcza ósmy bit,
        a same znaki o kodach > 128 beda przekodowywane na "bezpiczne"
        siedmio bitowe.
        - tin - z tego co wiem to na razie nie ma sposobu na to żeby zmusić
          go do poprawnego prepatowania nagłówka (sprubuję też sam zajrzeć
          do źrodeł). Z tego powodu chwilowo sam bedę musiał się przestawić
          na slrn-a.
        - slrn - w pliku slrn.rc trzeba zmienić linijkę z:

set mime_charset "iso-8859-1"
          na:
set mime_charset "iso-8859-2"

          Po tej modyfikacji w przypadku wystąpienia w liście znaków o
          kodach > 128 automatycznie jest dodawana wcześniej cytowana
          modyfikacja nagłówka listu. Modyfikacje można wykonać oczywiście
          też w lokalnym pliku konfiguracyjnym.
        - pine - tutaj też trzeba zmienić plik konfiguracyjny pine.conf,
          który znajduje się w /usr/local/lib lub /usr/lib. Zmienić trzeba:

character-set=
          na:
character-set=ISO-8859-2
 
          Powyższa modyfikacje można sobie wykonać z poziomu samej aplikacji
          (ale tylko lokalnie do ~/.pinerc). Main menu/Setup/Config, jest
          tam linijka "character-set=", w ktorej trzeba dodać (klawisz "a")
          tekst ISO-8859-2.
        - nn - ?????
        - cnews - ????
        - inn - ?????
        - elm - nie używam więc nie wiem.
        - standardowy mail, Mail - ?????.
        - inne - ?????.
   x Pager-y
        - less - trzeba mu zasygnalizować żeby wyświetlał znaki o kodach
          powyżej 128. Trzeba ustawić w środowisku zmienną
          LESSCHARSET na latin1.
        - most - nie uzywam i nie wiem.
        - inne - ???
   x Shell-e
        - sh - nie używam "czystego" sh więc nie wiem. Pod Linux-em jest to
          to samo co bash.
        - bash - używa przy wprowaczaniu znaków do lini poleceń funkcji z
          libreadline. Biblioteka ta uzywa pliku konfiguracyjnego ~/.inputrc
          i nie ma pliku globalnego (??, moze trzeba to zmienic lub na
          potrzeby polskie zmienic domyślne ustawienia w źródłach?). W pliku
          konfiguracyjnym powinny być trzy linijki:

set meta-flag on
set convert-meta off
set output-meta on

          Po czym możemy już swobodnie robić takie rzeczy jak
> mkdir bździągwa

        - csh, tcsh - po mimo, że sam używam tcsh to jeszcze nie mam
          przepisu.
        - ash - ???
        - zsh - ???
        - inne - ???
   x Procesory tekstu
        - TeX, LaTeX - nie używam, proszę o uzupełnienie, ale takie które
          będzie zgodne z ISO (nie sekwencje znaków). Czy Isnieje możliwość
          w dokumencie *TeX-owym zaznaczenia, że jest on w ISO-8859-2. Czy
          istnieje potrzeba dostosowywania obecnych rozwiązan do wymogów
          ISO?
   x Inne
        - ls (color) - żeby wyświetlał pliki, które w nazwach mają polskie
          znaki trzeba trzeba w /etc/DIR_COLORS dodac:
EIGHTBIT yes
OPTIONS -N
          po czym trzeba wywołać:
eval `dircolors`
          w celu utworzenia odpowiednich aliasów. Wskazane byłyby
          odpowiednie modyfikacje w /etc/profile i /etc/csh.cshrc
        - mc - tutaj nie wiem, ale z tego co rozmawialem z Adamem Tlałką
          wymagać to bedzie jeszcze drobnych zmian w samym mc.
        - allegro - nie uzywam wiec nie wiem.
        - IRC - wymagany IRC-II, w pliku /usr/lib/irc/script/global lub
          /usr/local/lib/irc/script/global trzeba dodać linijki:

set translation latin_1
set eight_bit_characters on

          To samo może sobie zrobic każdy użytkownik na własna rękę
          wstawiajac powyższe w ~/.ircrc (X-y).
          Co z innymi klientami IRC-a ?
        - inne - ????
   o fonty konsolowe do Linux-a:
        Tutaj jest pakiet Adama Tlałki:
        ftp://ftp.pg.gda.pl/pub/OS/Linux/util/system/iso02console.tgz
        W obecnej wersji nie zawiera jeszcze poprawek do nowego Init-a (choc
        na stronie ogonkowej potrzebne informacje sa juz umieszczone).
        Działa poprawnie (sam z niego w tej chwili kozystam). Jedyna wada w
        obecnej chwili jest to, ze jest wyposazony w tylko jeden font.
        Chetni do robienia fontow pod konsole proszeni sa o kontakt z Adamem
        (atlka_at_pg.gda.pl). Istnieje w ramach nowych mozliwosci jakie daja
        nowe kernel-e zrobienie fonfu z definicja 512 znakow (tez odsylam do
        Adama).
        W najbliższym czasie postaram się uzupełnić to co już wiadomo o
        namiary na edytory do fontów (chyba widziałem jakiegoś rpm-a).
        Żeby zachować standard rozkładu wzorców czcionek w pliku fontu
        zalecane jest zajrzenie do fontu jaki jest w pakiecie Adama, a w
        razie innych pomysłów prosze o kontak z nim.

   Powyższe zalecenia sformułowalem na podstawie doswiadczeń z Linux-em.

   o X-y
       x Aplikacje - Nie jestem za dobrze zorientowany w temacie ale czy po
         ustawieniu odpowiednich zmiennych (LANG, LC_CTYPE ..) jest możliwe
         automatyczne wybieranie różych (zlokalizowanych) app-defaults
         zasobów danej aplikacji (a może to inaczej się ma odbywać). Z tego
         co widzialem to w ramach dystrybucji źródeł asEdit ma wpełni
         spolonizowane zasoby. Zapewne inne aplikacje mają też spolnizowane
         zasoby (które?), może ktoś ma app-defauts do Netscape?

       x Fonty w ISO-8859-2
         W tej chwili są dostępne różnej jakości fonty w formatach bdf, pcf.
         Są to fonty rastrowe i stąd zapewne min. tytuł jednego z wątków na
         którym toczyla się ostra dyskusja, która się zaczeła od tego że
         fonty pod X-y są kiepsdkiej jakości (niestety, ale w tylko rastrowe).

         Fonty w formacie bdf, pcf należy uznać za przejściowe i ostatecznie
         powinnismy dążyć do tego żeby we wszystkich dystrybucjach Linux-a
         znalazły sie fonty w formacie pfa, pfb (wektorowe). Courier (pfb)
         gdzieś sie wala (widziałem, że Adam Tlałka mial). Niemniej nadal
         jest tego mało. Z wykożystaniem Mac-a probóje zrobić jeszcze kilka
         ale idzie mi to opornie. Zdaje sie, że ten Courier był udostepniony
         free przez IBM, może jest tego więcej.

         Lista zasobów z fontami jest na stronie ogonkowej.
         Moge ja uzupełnić o zasoby pod RedHat-a w postaci rpm-a:
           ftp://ftp.pg.gda.pl/pub/OS/Linux/xtras-PG/kloczek/RPMS/

         Czy ktoś wie jak wygląda sprawa z UNICODE i XFree ? Gdzieś są
         żródła uxterm-a (Unicode Xterm). Zapewne zachacze o nie w
         najbliższym czasie.

  o Inne U*nix-y nix Linux
        Jak wygląda sytuacja na innych U*nix-ach ? Może jakieś szczegółowe
        rady dla tych co jeszcze nie wiedzą co i jak zrobić ?

Po przedyskutowaniu i uzupelnieniu zapewne możnaby to co z tego powstanie
dołaczyć do info na stronie ogonkowej i w Polish_HOWTO.

------------------------- pl.irc -----------------------------------------

Od dzisiaj nie ma juz lamer-ów, są tylko łamagi :-).

------------------------- pl.comp.pecet ----------------------------------

Klient ssh na OS/2 wymaga dopracowania tak żeby był w stanie wyświetlać
polskie litery. Informacje o telbinie umożliwające prace z ISO na terminalu
pod Dos-em są na stronie ogonkowej.

------------------------- pl.rec.film ------------------------------------

Ogłaszam konkurs na tytuły filmów z "oknem" w tytule (moga być nie polskie).
Poszukiwane są w kategoriach: horr, tasiemc serialowy, dramat
psychologiczy. Ostatnio w TV byla "Panienka z okienka", ale to był bajka
więc się nie liczy.

--------------------------------------------------------------------------

Od dzisiaj bedę wytykał wsystkim na new-ach i w poczcie prywatnej,
publicznej brak polskich liter :-).

Mam nadzieje, że nie zanudziłem na śmierć, a i dyskusja bedzie w tym wypadku
wyjątkowo rzeczowa i owocna.

Pozdrawiam

kloczek

PS. Spolszczyłem sygnature i od dziasiaj używam polskich liter. Choć
przestawienie się na język ojczysty idzie mi cieżko. Kto
nastepny?

-----------------------------------------------------------
"Ludzie nie maja problemów, tylko sobie sami je stwarzają"
-----------------------------------------------------------
Tomasz Kłoczko, student, PG FTiMS | e-mail : kloczek_at_rudy.mif.pg.gda.pl



To archiwum zostało wygenerowane przez hypermail 2.1.7 : Wed 19 May 2004 - 15:58:26 MET DST