Re: Standardy - jakie one w końcu są

Autor: Wojciech Myszka (W.Myszka_at_immt.pwr.wroc.pl)
Data: Wed 03 Sep 1997 - 11:15:02 MET DST


On Tue, 2 Sep 1997, Michal Politowski wrote:

> Po prześledzeniu kilku burzliwych dyskusji nt. wyższości Wielkanocy
> nad stroną kodową *******-1250, przejrzeniu RFC 1521, 1590, 1700 i
> zajrzeniu na ftp.isi.edu/<jakas_sciezka>/iana/ chcę się zapytać:
  ---
  Nie przeczytałeś wszystkiego co trzeba. Lista jest znacznie dłuższa :-)
  Zwłaszcza należy czytać NAJNOWSZE RFC dotyczące MIME RFC 2045 RFC 2046
  RFC 2047 RFC 2048 RFC 2049.
  ---
> 1. Czy skoro w RFC 1700 jako jeden z dopuszczalnych zestawów znaków
> występuje IBM cp852 zawierający przecież polskie litery to mogę (ze
> świadomością, że prawie nikt tego nie odczyta) zacząć go stosować w
> poczcie, Usenecie i na stronach www?
  ---
  Jeżeli Twój program pocztowy zechce wstawić odpowiednią informację o
  zastosowanym kodowaniu znaków w nagłówku poczty to oczywiście, że
  możesz. Jeżeli jednak zajrzeć do RFC na temat MIME - nie zostały tam
  "dopuszczone" inne zestawy znaków niz US-ASCII i ISO-8859-x. Zatem,
  będzie to musiało być x-costam (ale x-costam można stosować tylko tam,
  gdzie obie strony się dogadają że je rozumieją).

> 2. Czy jeśli M$ wystąpi do IANA o zarejestrowanie *******-1250
> (zaraz, zaraz czy oni aby już tego nie zrobili?) i zestaw ten
  [...]
  Już to oczywiście zrobili. Osobne pytanie jakie to niesie konsekwencje
  formalne? IMHO minimalne lub żadne. Gdyż jeżeli się w czytać w RFC
  dotyczące MIME (i te starsze i te najnowsze) jest tam wpisana prawda,
  która krotko tłumaczona brzmi tak "po cholerę tworzyę nowe byty skoro
  nie wnoszę one nic nowego?" i nazywana bywa przez filozofów brzytwą
  Ockhama (jeżeli nie pokręciłem pisowni nazwiska). Cóż by nie mówić o
  cp852 i cp1250 są one w pewnym sensie "zgodne" z iso-8859-2 i nie ma
  potrzeby korzystania z nich.
  ---
> 4. Z innej beczki. Czy jest jakieś RFC nt. używania osiągnięć MIME
> nie w poczcie, czy też np w Usenecie 'Content-Type' itp. są stosowane
> jako rzecz oczywista?
  ---
  Sprawa w przypadku newsów jest najbardziej niejasna :-) RFC opisujące
  protokół NNTP jest baaaardzo stare i nie było modyfikowane (co jest
  pewnego rodzaju ewenementem :-)

  Większość guru skłania się ku tezie, że należy tu również stosować MIME.
  Czemu?

  Cała idea (o jakiej dziś debatujemy) sprowadza się do tego: jeżeli
  generujemy dokument, który zawiera znaki z jakiegoś zestawu narodowego i
  nie ma pełnej jednosnaczności jak te znaki są zakodowane to w nagłówku
  tego dokumentu powinna się pojawić informacja o tym pozwalająca odbiorcy
  dostosować się i informacje odpowiednio przekodować, przekształcić czy
  co tam chce z nią zrobić. I nie wymyślono nic innego niż MIME do tego.
  (Skoro nawet http używa do tych celów MIME to czemu nie newsy).

  Sprawa byłaby znacznie prostsza, gdyby od samego początku i bez żadnych
  wyjątków do korespondencji komputerowej używać jakiegoś wielkiego,
  wspólnego dla wszystkich alfabetu (mam na myśli coś na kształt Unicode).
  Wówczas byłoby jasne - standardowym "zestawem" znaków jest Unicode. Do
  uzgodnienia pozostaje sposób kodowania.

  Podsumowywując: nie należy w oczekiwaniu na Unicode mnożyć bytów
  nadaremno i dodawać cp852, cp1250 cp-cokolwiek do nagłówków. Należy
  dążyć do promowania tego co jest w RFC i przygotowywać sie do Unicode
  (co już parę osób tu robi :-)

  Raz jeszce powtórze: NIE JEST PROBLEMEM UŻYTWANIE W POCZCIE I
  GDZIEKOLWIEK INDZIEJ CP852, CP1250, ISO-8859-2, cokolwiek. Pod warunkiem
  wszakrze, że odpowiednia informacja zostanie (zgodnie z prawdą)
  umieszczona w odpowiednim nagłówku MIME. I już sprawą odbiorcy będzie
  odpowidnie tego przekodowane, przekształcenie i wyświetlenie. Nie można
  jedna (ze względów czysto praktycznych godzić się na wszystko co jest w
  RFC1700 - bo tam pewno też jest i coś takiego na nazwę charsetu jak
  "unknown 8bit" - a za takim tekstem zero informacji jak otrzymana
  wiadomość rozkodować i traktować.

  Jest w internecie i mediach grupa osób które myślą tak: skoro ja coś
  zrobie nie zważając na standardy i wszytskie polskie litery widzę OK i
  mój kumpel wszystkie polskie litery widzi OK i Pan redaktor X wszystkie
  polskie litery widzi OK to to jest zgodne ze standardem!

  I z tą częścią internetowej społeczności dydkutuje się bardzo trudno...

  Przepraszam za przynudzanie (i podejmowanie dyskusji na ograny temat)

  Pozdrawiam
  Wojtek

> PS. Nie jestem pewien czy wybrałem najlepszy możliwy wariant
> Followup-To.
  ---
  Najgorszy możliwy :-) Winno być pl.comp.ogonki



To archiwum zostało wygenerowane przez hypermail 2.1.7 : Wed 19 May 2004 - 16:05:11 MET DST