Autor: Wojciech Myszka (W.Myszka_at_immt.pwr.wroc.pl)
Data: Wed 03 Sep 1997 - 11:15:02 MET DST
On Tue, 2 Sep 1997, Michal Politowski wrote:
> Po prześledzeniu kilku burzliwych dyskusji nt. wyższości Wielkanocy
> nad stroną kodową *******-1250, przejrzeniu RFC 1521, 1590, 1700 i
> zajrzeniu na ftp.isi.edu/<jakas_sciezka>/iana/ chcę się zapytać:
---
Nie przeczytałeś wszystkiego co trzeba. Lista jest znacznie dłuższa :-)
Zwłaszcza należy czytać NAJNOWSZE RFC dotyczące MIME RFC 2045 RFC 2046
RFC 2047 RFC 2048 RFC 2049.
---
> 1. Czy skoro w RFC 1700 jako jeden z dopuszczalnych zestawów znaków
> występuje IBM cp852 zawierający przecież polskie litery to mogę (ze
> świadomością, że prawie nikt tego nie odczyta) zacząć go stosować w
> poczcie, Usenecie i na stronach www?
---
Jeżeli Twój program pocztowy zechce wstawić odpowiednią informację o
zastosowanym kodowaniu znaków w nagłówku poczty to oczywiście, że
możesz. Jeżeli jednak zajrzeć do RFC na temat MIME - nie zostały tam
"dopuszczone" inne zestawy znaków niz US-ASCII i ISO-8859-x. Zatem,
będzie to musiało być x-costam (ale x-costam można stosować tylko tam,
gdzie obie strony się dogadają że je rozumieją).
> 2. Czy jeśli M$ wystąpi do IANA o zarejestrowanie *******-1250
> (zaraz, zaraz czy oni aby już tego nie zrobili?) i zestaw ten
[...]
Już to oczywiście zrobili. Osobne pytanie jakie to niesie konsekwencje
formalne? IMHO minimalne lub żadne. Gdyż jeżeli się w czytać w RFC
dotyczące MIME (i te starsze i te najnowsze) jest tam wpisana prawda,
która krotko tłumaczona brzmi tak "po cholerę tworzyę nowe byty skoro
nie wnoszę one nic nowego?" i nazywana bywa przez filozofów brzytwą
Ockhama (jeżeli nie pokręciłem pisowni nazwiska). Cóż by nie mówić o
cp852 i cp1250 są one w pewnym sensie "zgodne" z iso-8859-2 i nie ma
potrzeby korzystania z nich.
---
> 4. Z innej beczki. Czy jest jakieś RFC nt. używania osiągnięć MIME
> nie w poczcie, czy też np w Usenecie 'Content-Type' itp. są stosowane
> jako rzecz oczywista?
---
Sprawa w przypadku newsów jest najbardziej niejasna :-) RFC opisujące
protokół NNTP jest baaaardzo stare i nie było modyfikowane (co jest
pewnego rodzaju ewenementem :-)
Większość guru skłania się ku tezie, że należy tu również stosować MIME.
Czemu?
Cała idea (o jakiej dziś debatujemy) sprowadza się do tego: jeżeli
generujemy dokument, który zawiera znaki z jakiegoś zestawu narodowego i
nie ma pełnej jednosnaczności jak te znaki są zakodowane to w nagłówku
tego dokumentu powinna się pojawić informacja o tym pozwalająca odbiorcy
dostosować się i informacje odpowiednio przekodować, przekształcić czy
co tam chce z nią zrobić. I nie wymyślono nic innego niż MIME do tego.
(Skoro nawet http używa do tych celów MIME to czemu nie newsy).
Sprawa byłaby znacznie prostsza, gdyby od samego początku i bez żadnych
wyjątków do korespondencji komputerowej używać jakiegoś wielkiego,
wspólnego dla wszystkich alfabetu (mam na myśli coś na kształt Unicode).
Wówczas byłoby jasne - standardowym "zestawem" znaków jest Unicode. Do
uzgodnienia pozostaje sposób kodowania.
Podsumowywując: nie należy w oczekiwaniu na Unicode mnożyć bytów
nadaremno i dodawać cp852, cp1250 cp-cokolwiek do nagłówków. Należy
dążyć do promowania tego co jest w RFC i przygotowywać sie do Unicode
(co już parę osób tu robi :-)
Raz jeszce powtórze: NIE JEST PROBLEMEM UŻYTWANIE W POCZCIE I
GDZIEKOLWIEK INDZIEJ CP852, CP1250, ISO-8859-2, cokolwiek. Pod warunkiem
wszakrze, że odpowiednia informacja zostanie (zgodnie z prawdą)
umieszczona w odpowiednim nagłówku MIME. I już sprawą odbiorcy będzie
odpowidnie tego przekodowane, przekształcenie i wyświetlenie. Nie można
jedna (ze względów czysto praktycznych godzić się na wszystko co jest w
RFC1700 - bo tam pewno też jest i coś takiego na nazwę charsetu jak
"unknown 8bit" - a za takim tekstem zero informacji jak otrzymana
wiadomość rozkodować i traktować.
Jest w internecie i mediach grupa osób które myślą tak: skoro ja coś
zrobie nie zważając na standardy i wszytskie polskie litery widzę OK i
mój kumpel wszystkie polskie litery widzi OK i Pan redaktor X wszystkie
polskie litery widzi OK to to jest zgodne ze standardem!
I z tą częścią internetowej społeczności dydkutuje się bardzo trudno...
Przepraszam za przynudzanie (i podejmowanie dyskusji na ograny temat)
Pozdrawiam
Wojtek
> PS. Nie jestem pewien czy wybrałem najlepszy możliwy wariant
> Followup-To.
---
Najgorszy możliwy :-) Winno być pl.comp.ogonki
To archiwum zostało wygenerowane przez hypermail 2.1.7 : Wed 19 May 2004 - 16:05:11 MET DST