Re: [XP] Systemowa wyszukiwarka - dwie wersje

Autor: j_marek <j_marek_at_USUN_TO.gazeta.pl>
Data: Fri 07 Apr 2006 - 12:55:26 MET DST
Message-ID: <e15gik$19uj$3@news2.ipartners.pl>
Content-Type: text/plain; format=flowed; charset="iso-8859-2"; reply-type=response

W wiadomości: e12i5g$oeb$2@polsl.pl,
Radosław Sokół <Radoslaw.Sokol@polsl.pl> napisał(a):
> j_marek napisał(a):
>> podobnie. Na moje oko to tekst w zasobach .dll-ek i .exe-ków właśnie
>> jakoś podobnie jest kodowany. Przynajmniej w hexedytorze widać znaki
>> o kodach zerowych między zwykłymi znakami tekstu.
>
> Zasoby kodowane są w UCS-2, o ile pamiętam.
[...]

Witam!

W każdym razie jest to jakieś kodowanie Unicode, szczegóły powinna podać
dokumentacja.

Jeśli zdecydowaliby się użyć kodowania UTF-16 to jeden kod Unicode może być
reprezentowany na kilku znakach 16-bitowych (2 bajtowych). Jeśli natomiast
UCS-2 to nie ma takiej możliwości. Oznacza to, że nie można ścisnąć
wszystkich kodów Unicode do 16-bitowej reprezentacji i implementuje się
tylko część standardu (Plan 0):
http://en.wikipedia.org/wiki/UTF-16

Dla przykładu w .NET stringi są kodowane w UTF-16.

Chyba prawdziwa wyszukiwarka dla twardzieli powinna uwzględniać więcej
kodowań tekstu. Np.:
http://en.wikipedia.org/wiki/EBCD

A jak ktoś ma kolekcje tekstów pochodzących z mainframów, nie mówiąc już o
naszej Mazovi ;-)

-- 
Pozdrawiam,
Marek Janaszewski
[ j_marek(małpa)gazeta(kropka)pl ]
[ == USUN_TO. z adresu == ] 
Received on Fri Apr 7 13:00:14 2006

To archiwum zostało wygenerowane przez hypermail 2.1.8 : Fri 07 Apr 2006 - 13:42:02 MET DST