Re: [OE] Plik .dbx przekroczył 2 GB - jak uratować maile?

Autor: Mariusz Kruk <Mariusz.Kruk_at_epsilon.eu.org>
Data: Fri 21 Mar 2008 - 14:40:21 MET
Message-ID: <slrnfu7em5.eqv.Mariusz.Kruk@epsilon.rdc.pl>
Content-Type: text/plain; charset=ISO-8859-2

epsilon$ while read LINE; do echo "$LINE"; done < "Andrzej P. Wozniak"
>>>>>>> A jak jest w Windows Mail pod Vistą? Przerzuciłem tam właśnie
>>>>>>> firmową pocztę z Thundebirda i zaczynam się niepokoić :)
>>>>>> Tam przecież nie ma plików DBX tylko pojedyncze .eml i .nws.
>>>>> Co ma oczywiste zalety, ale ciekawy tez jestem - jakie wady?
>>>> Przy małych plikach - znacząco większe zużycie dysku.
>>> brak fragmentacji pliku inboxa czyli porzy kasowaniu maili oszczedzanie
>>> miejsca (jesli nie kompaktuje sie folderow) i brak potrzeby
>>> kompaktowania.
>> Pytanie było o wady ;->
>Wadą jest porozrzucanie wielkiej liczby małych plików po całym dysku, co
>daje większą liczbę fragmentów niż w pofragmentowanym folderze dbx.

Co nie ma praktycznego znaczenia, jeśli używasz indeksu i nie musisz
czytać wszystkich plików. Natomiast ma tę zaletę, że możesz od razu
znaleźć właściwy plik bez przeszukiwania całego mailboksa.
(niech mi ktoś przypomni, w NTFS da się łatwo dobrać do dowolnego bloku
pliku, czy trzeba jak w FAT przeszukiwać od początku?)

>Wadą
>jest fragmentacja kobylastego pliku indeksowego i konieczność jego
>kompaktowania. Nie sprawdzałem, czy zaznaczanie wiadomości jako skasowanych
>w folderze dbx (czytaj: wywalanie z indeksu) jest szybsze niż usuwanie
>wiadomości z systemu plików, ale wystarczy, żeby było szybsze niż kasowanie
>z pliku indeksowego W(L)Mail, co przy rosnącej liczbie wiadomości staje się
>więcej niż pewne. Dlaczego - patrz niżej.
>
>>> BYc moze wieksza ilosc plikow spowoduje nieco wolniejsze
>>> wczytywanie inboxa (szybciej sie czyta z jednego wilekiego pliku niz z
>>> wielu malych, tak jak szybciej kopiuje sie duzy plik a nie wiele malych)
>> Do tego można użyć indeksów.
>Jakiego rodzaju indeksy masz na myśli?

Zazwyczaj programy używające maildirów czytają maile raz tworząc indeks
z najważniejszych nagłówków.

>Folder dbx zawiera wiadomości przemieszane z indeksem nagłówków i
>znaczników. Przy otwieraniu folderu OE skanuje plik wczytując filtr widoku i
>stosując go razem z zadanym sortowaniem według kolumn do wczytywanego
>indeksu nagłówków.

Przy otwieraniu wystarczy porównać czasy modyfikacji katalogu, oraz
pliku indeksowego, żeby wiedzieć, czy trzeba w ogóle uaktualniać indeks.

>W Windows (Live) Mail jest tylko *jeden* indeks nagłówków i znaczników na
>*wszystkie* pliki wiadomości, do tego dane w nim są zapisane w Unikodzie
>(UTF-16), a nie w UTF-8, jak można by oczekiwać. Jako oddzielne pliki są
>zapisywane tylko wiadomości pobrane w całości, więc pojedynczy katalog z
>grupą jest nieprzenośny.

Ależ ja nie twierdzę, że rozwiązanie zastosowane akurat w Windows Mail
jest koniecznie najlepsze możliwe. W ogólności natomiast trzymanie
wiadomości w osobnych plikach potrafi być całkiem rozsądne.

-- 
d'`'`'`'`'`'`'`'`'`'`'`'`'Yb ``If  all  else  fails,  read  the  instruc-
`b  Kruk@epsilon.eu.org   d' tions.''
d' http://epsilon.eu.org/ Yb 
`b,-,.,-,.,-,.,-,.,-,.,-,.d' 
Received on Fri Mar 21 14:45:11 2008

To archiwum zostało wygenerowane przez hypermail 2.1.8 : Fri 21 Mar 2008 - 15:42:02 MET