Re: content-type=text/html (bylo: AltaVista i inne przeszukiwarki)

Autor: Grzegorz Staniak (gstaniak_at_golem.umcs.lublin.pl)
Data: Mon 17 Feb 1997 - 21:53:16 MET


Wojtek Sylwestrzak wrote:
>
> In pl.comp.www Grzegorz Staniak <gstaniak_at_golem.umcs.lublin.pl> wrote:
>
> : No coz, na poziomie protokolu jest to kwestia identyfikacji
> : typu medium - w tym zakresie HTTP uzywa metod MIME, tzn.
> : "Content-type" i dzielenie rejestru IANA. Charset jako
> : opcjonalny parametr typu medium powinien natomiast jak
> : najszybciej zaniknac, na rzecz wprowadzenia obslugi
> : ISO 10646 jako bazowego zestawu znakow HTML. Cougar
>
> Hm, HTTP 1.1 w koncu wymaga, zeby klient respektowal
> charset z content-type z naglowka http.
> W 1.0 jak wiemy roznie to bylo...

Tak. Wedlug HTTP/1.1 kazde "compliant software" musi
rozpoznawac parametr "charset", Nie pamietam ktore to
przegladarki sie wieszaly po otrzymaniu cahrsetu ISO
jako parametru typu medium, ale nie jest to w HTTP/1.1
dopuszczalne zachowanie.
 
> Czyli jesli wierzymy, ze http 1.1 bedzie powoli (a moze nie tak powoli)
> wypieral http 1.0, to mozemy juz powoli wstawiac wlasciwy charset
> do http zamiast w html.

Oczywiscie. 1.1 juz sie zaczyna upowszechniac - Apache 1.2 jest
z nim w pelni zgodny (co powoduje np. klopoty z NN i MSIE chocby
w obsludze zakresow - byteranges - przy korzystaniu z PDF), Lynx
jest juz blisko, punkt odniesienia publikowany przez W3C tez
juz istnieje (libwww dla 1.1, Jigsaw jako serwer w pelni 1.1
obslugujacy, chyba tez Amaya). Niedlugo i inni zechca wykorzystac
wyzszy numerek jako argument handlowy - ciekawe z jakim skutkiem.

A wstawianie charsetu do HTTP jest np. w Apache'u bardzo proste
- dokumenty w wersjach narodowych z odpowiednimi rozszerzeniami
(.html.en, .html.po, etc.) i przypisane rozszerzeniom typy
np. przez "AddType text/html;charset=ISO-8859-2 .po". Powinno
dzialac dobrze, moe nawet jakies przegladarki to obsluza.

> Albo niezaleznie od html ??

Hm, jesli taka proteza pozwala browserom automatycznie
przelaczyc kodowanie, to niezaleznie, tyle ze trzeba wtedy
zadbac o spojnosc. Tylko od oprogramowania zalezy, co bedzie
dla niego wazniejsze, naglowek HTTP czy META.
 
> unicode i iso-10646 mysle, ze dopiero w dalszej kolejnosci ..

No niestety. Problemy bylyby raz na zawsze z glowy (i pewnie
cala fura nowych).
 
> --w

--
Grzegorz Staniak                - a freelance at large
<gstaniak_at_golem.umcs.lublin.pl>


To archiwum zostało wygenerowane przez hypermail 2.1.7 : Wed 19 May 2004 - 16:02:42 MET DST