Re: [OE] Plik .dbx przekroczył 2 GB - jak uratować maile?

Autor: Andrzej P. Wozniak <uszer_at_poczta.onet.pl.invalid>
Data: Fri 21 Mar 2008 - 01:14:16 MET
Message-ID: <fruv4j$mtr$1@mx1.internetia.pl>
Content-Type: text/plain; charset="iso-8859-2"

Osoba podpisana jako Mariusz Kruk <Mariusz.Kruk@epsilon.eu.org> w artykule
<news:slrnfu5dtn.eqv.Mariusz.Kruk@epsilon.rdc.pl> pisze:

> epsilon$ while read LINE; do echo "$LINE"; done < "f1j@k_?"
>>>>>> A jak jest w Windows Mail pod Vistą? Przerzuciłem tam właśnie
>>>>>> firmową pocztę z Thundebirda i zaczynam się niepokoić :)
>>>>> Tam przecież nie ma plików DBX tylko pojedyncze .eml i .nws.
>>>> Co ma oczywiste zalety, ale ciekawy tez jestem - jakie wady?
>>> Przy małych plikach - znacząco większe zużycie dysku.
>> brak fragmentacji pliku inboxa czyli porzy kasowaniu maili oszczedzanie
>> miejsca (jesli nie kompaktuje sie folderow) i brak potrzeby
>> kompaktowania.
> Pytanie było o wady ;->

Wadą jest porozrzucanie wielkiej liczby małych plików po całym dysku, co
daje większą liczbę fragmentów niż w pofragmentowanym folderze dbx. Wadą
jest fragmentacja kobylastego pliku indeksowego i konieczność jego
kompaktowania. Nie sprawdzałem, czy zaznaczanie wiadomości jako skasowanych
w folderze dbx (czytaj: wywalanie z indeksu) jest szybsze niż usuwanie
wiadomości z systemu plików, ale wystarczy, żeby było szybsze niż kasowanie
z pliku indeksowego W(L)Mail, co przy rosnącej liczbie wiadomości staje się
więcej niż pewne. Dlaczego - patrz niżej.

>> BYc moze wieksza ilosc plikow spowoduje nieco wolniejsze
>> wczytywanie inboxa (szybciej sie czyta z jednego wilekiego pliku niz z
>> wielu malych, tak jak szybciej kopiuje sie duzy plik a nie wiele malych)
> Do tego można użyć indeksów.

Jakiego rodzaju indeksy masz na myśli?

Folder dbx zawiera wiadomości przemieszane z indeksem nagłówków i
znaczników. Przy otwieraniu folderu OE skanuje plik wczytując filtr widoku i
stosując go razem z zadanym sortowaniem według kolumn do wczytywanego
indeksu nagłówków.

W Windows (Live) Mail jest tylko *jeden* indeks nagłówków i znaczników na
*wszystkie* pliki wiadomości, do tego dane w nim są zapisane w Unikodzie
(UTF-16), a nie w UTF-8, jak można by oczekiwać. Jako oddzielne pliki są
zapisywane tylko wiadomości pobrane w całości, więc pojedynczy katalog z
grupą jest nieprzenośny.
Jeśli masz ochotę sprawdzić, czy to jest zaleta, spróbuj z serwera
news-archive.icm.edu.pl ściągnąć wszystkie nagłówki z grupy control.cancel,
pl.test czy innej równie dużej. Jak będziesz miał jeszcze cierpliwość, to
zamknij potem program i uruchom go ponownie.
Przypuszczam, że do pomiaru czasu zamiast stopera czy minutnika będziesz
musiał użyć budzika ;-P

-- 
Andrzej P. Woźniak  uszer@pochta.onet.pl  (zamień miejscami z<->h w adresie)
Received on Fri Mar 21 01:25:18 2008

To archiwum zostało wygenerowane przez hypermail 2.1.8 : Fri 21 Mar 2008 - 01:42:02 MET