Re: Nielegalne binaria na news-serwerach

Autor: Krzysztof Halasa <khc_at_pm.waw.pl>
Data: Mon 18 Apr 2005 - 22:55:14 MET DST
Message-ID: <m3hdi3erf1.fsf@defiant.localdomain>
Content-Type: text/plain; charset=iso-8859-2

Kamil Raczynski <raczek@raczek.yupe.net> writes:

> Ależ wyświetlił poprawnie całą wiadomość.

Wiec w czym problem?

> Zwróciłem tylko uwagę że w
> nagłówkach miałeś po pierwsze:

A wiec szukales specjalnie w naglowkach?

> Content-Type: multipart/mixed; boundary="=-=-="

... co wydaje sie sensowne (a nawet jest wymagane), jesli list zawiera
wiecej niz jeden charset? RTF np. RFC 2046.

> A po drugie, jak zajrzysz w źródło wiadomości, to zobaczysz, że wiadomość
> składa się z pięciu części. Charset ustawiony jest raz na ISO 8859-2, a raz
> na ISO 8859-1. Pytam z czystej ciekawości, bo nie widziałem jeszcze
> (przynajmniej w hierarchii pl.*) tak oznaczonej i zakodowanej wiadomości.

Po przeanalizowaniu dlaczego tak sie dzieje dochodze do wniosku, ze
Gnus + MIME otrzymujac w UTF8 litere "ó" i przeksztalcajac ja do ISO 8859
uzywa charsetu 8859-1 a nie -2 (co wynika zapewne z tego, ze
przeksztalcenie UTF8->8859 musi byc funkcja, a wiec trzeba sie na cos
zdecydowac - ta litera wystepuje w -1 i w -2). Nastepnie Gnus nie
wie juz, ze 8859-1 "ó" to to samo co 8859-2 "ó" i ze mozna to
zoptymalizowac, jesli reszta jest w 8859-2.

> W zasadzie
> ISO 8859-1 nie jest w pl.* dopuszczone.

Mylny poglad. Jak najbardziej jest dopuszczone, i zawsze bylo
(w kazdym razie od wejscia w zycie MIME, bo wczesniej to bylo troche
inaczej).

Wszelkie FAQ i inne netykiety, ktore twierdza cos innego, albo
po prostu sa bledne, albo uzyto w nich niezrecznego sformulowania,
i wyszlo cos innego niz autor chcial napisac.

Natomiast jesli masz na mysli zestawy znakow, ktore zawieraja
(wszystkie) polskie znaki, to wtedy oczywiscie jest to prawda
- jedynym zestawem znakow do pisania z polskimi znakami jest 8859-2.
(pomijajac UTF8, ktorego nie zaleca sie stosowac, ale niewatpliwie
ta sytuacja sie zmieni).

Stosowanie ISO-8859-1 (a takze np. CP1250 czy jak mu tam) jest
zabronione w takim sensie, ze niektorzy uzywaja kodowania np. 8859-2
lub CP1250 z deklaracja np. 8859-1 (lub CP1250, a takze czasem
8859-2 lub US-ASCII). Ale moj list niczego takiego nie zawieral,
wszystko sie zgadzalo.

> A skoro sam celowo tego nie
> zrobiłeś, to znaczy, że z Twoim czytnikiem jest coś "nie teges"(?).

Watpliwe (albo raczej niewatpliwie tak _nie_ jest).
Choc zgadzam sie ze algorytm kodowania przy konwersji z UTF8 moglby
byc zoptymalizowany - nie bylo tu jednak zadnego bledu.

Natomiast dziwi mnie, ze w ogole ktokolwiek zauwazyl, ze ten list
sklada sie z 5 czesci. Czytnik powinien wyswietlic je prawidlowo,
dokladnie tak samo jak gdyby uzyty byl tylko zestaw ISO-8859-2.
Skad wiedziales, ze tam jest tyle tych czesci?

-- 
Krzysztof Halasa
Received on Mon Apr 18 23:00:35 2005

To archiwum zostało wygenerowane przez hypermail 2.1.8 : Mon 18 Apr 2005 - 23:40:03 MET DST