LANG (bylo: Re: content-type=text/html)

Autor: Grzegorz Staniak (gstaniak_at_golem.umcs.lublin.pl)
Data: Wed 12 Feb 1997 - 20:06:18 MET


Tomasz Kłoczko wrote:

[...]

> Jeszcze lepiej by był gdyby dodano <lang=...></lang> (a może już w jakiejś
> postaci to jest ?),

Owszem, jest. Cougar (wersja rozwojowa HTML 3.2, czyli tzw. HTML 3.2+)
wprowadza pod wzgledem internacjonalizacji (okreslanej pieknym a
zwiezlym
skrotem I18N - "18" to ilosc skompresowanych literek) kilka istotnych
nowosci: ISO-10646 (Unicode) w deklaracji SGML jako BASESET, czyli
bazowy zestaw znakow dla tresci HTML, atrybut LANG na praktycznie
wszystkich
elementach poziomu tekstu, oraz atrybut DIR, czyli domyslny kierunek
tekstu
(wartosci "rtl" lub "ltr" - "right to left", "left to right").

> dawałoby to trochę szesze możliwości szczególnie
> przeszukiwarkom, przyszłym programom automatycznie tłumaczącym strony (np. w
> przeglądarkach). Dalej w edytorach weryfikacjących pisownię, speeling w
> przeglarkach. Charset to byłoby za mało do takich ficzerów. Ciekawe jak to
> jest rozwiązane w SGML-u ?

Roznie, bo SGML to specyfikacja konstrukcji jezykow oznaczen, a nie
jakis pojedynczy jezyk. Mechanizmy jakich mozna uzyc to wlasnie
odpowiednio dobrany BASESET, atrybuty, czasami wygodne jest wskazanie
na jakis charset czy encoding.
 
> : Mozeby sprobowac to zmienic ?
> : Co o tym myslicie ?
>
> Jestem za. Tylko jak to przeforsować ? Jak takie rzeczy się robi czyli, z
> której strony podejść do byka ;) ??

Naciskac na producentow. Netscape w 4.0 juz wprowadza Unicode jako
jedno z kodowan dokumentu, ale chodzi o uswiadomienie calosci
branzu, ze problem jest istotny i powinien byc systemowo,
calosciowo, standardowo rozwiazany.
 
> kloczek

--
Grzegorz Staniak                - a freelance at large
<gstaniak_at_golem.umcs.lublin.pl>


To archiwum zostało wygenerowane przez hypermail 2.1.7 : Wed 19 May 2004 - 16:02:37 MET DST