Lista pecet@man.lodz.pl
[Lista archiwów] [Inne Listy]

Re: [PECET] Samsung SSD EVO 870 1TB - SMART parametr C7 (CRC Error Coun

To: pecet@man.lodz.pl
Subject: Re: [PECET] Samsung SSD EVO 870 1TB - SMART parametr C7 (CRC Error Count) - to nie kabel sygnałowy:)
From: Tomaszek <tomaszek1983@onet.pl>
Date: Sun, 4 Jul 2021 22:54:14 +0200
W dniu 2021-07-04 o 21:39, pioruns pisze:
On 04/07/2021 19:25, Tomaszek wrote:

Ale ja mam pytanie: czy to może być przyczyna generowania się błędów CRC?

Kto wie, moze. Powinienes dazyc do wlaczenia tej opcji przy najblizszym formacie systemu, upgrade etc.

Wziąłem za mordę AHCI i okazuje się, że miałem i nadal mam je włączone w biosie (SATA controller type: AHCI), w systemie (sprawdzone przez wiersz polecenia poleceniem fsutil) To samo twierdzi menadżer urządzeń (działające prawidłowo urządzenie o nazwie: standardowy kontroler SATA AHCI) oraz rejestr systemu(HKLM>System>CurrentControlSet>Services>storahci "Start" wartość DWORD ustawiona na 0)

Tak więc wszystko wokół twierdzi, że mam AHCI włączone...tylko nie Samsung Magician:)

Małe śledztwo i sprawa wygląda tak:
https://us.community.samsung.com/t5/Monitors-and-Memory/Samsung-Magician-AHCI-deactivated/td-p/1792771

Pies z nimi tańcował:)


Moja interpretacja: (moge sie mylic, jak cos prosze mnie poprawic)
Glowna przyczyna bledow CRC, jaka mi sie nasuwa, to po prostu specyfika dzialania SSD - twoj model Samsung 870 EVO posiada kosci Samsung V-NAND 3bit TLC [1], ktore pamietaja 8 STANOW NAPIECIA w kazdej komorce. A wiec przykladowo 0V, 0.125V, 0.25V, 0.375V itd. (to tylko obrazowo), odpowiada to bitom 000, 001, 010, 011 itd. Zamiast 0V i 1V = bit 0 lub 1, tak jak bylo kiedys (bylo zero problemu z odczytaniem takiej komorki). Co jakis czas (czyt. praktycznie nagminnie) kontroler nie bedzie pewny co tam jest w tych komorkach, bo zamiast 0.375V juz jest 0.35V, tydzien pozniej 0.34V i tak dalej. Dlatego kontroler caly czas odpytuje chipy, nadpisuje sektory, odswieza te napiecia, musi utrzymac wszystko w idealnym stanie, inaczej po miesiacu czy roku nie bylby w stanie odczytac zawartosci komorek i mialbys data loss. Aby to wszystko sie trzymalo kupy, SSD uzywaja zaawansowanych, wlasnosciowych technologii redundancji, wszelkie RAIDy i sprawdzanie CRC *wszystkiego* ma miejsce w srodku, transparentnie dla Ciebie, caly czas w przy kazdej operacji I/O. Jak widac, pamiec w chipach twojego egzemplarza jest dla samego kontrolera tak koszmarna, ze zaznacza sobie w logu ze nie dal rady ogarnac tego bajzlu i musial uzyc error correction, wyliczac i zgadywac zawartosc komorki z danych nadmiarowych itp. Wszystko to jest by-design - wszakze kupiles dysk z pamiecia 3bitowa - 8 stanow napiecia na komorke. 8x mniej kosci pamieci dla producenta w porownaniu do SLC (1 bitowa pamiec), oni oszczedzaja na kosciach, a Ty masz tanszy dysk, najgorzej ma kontroler bo przez cale zycie dysku bedzie musial orac przez ten bajzel prawie-ze analogowych odczytow zamiast zer i jedynek, i poprawiac je nieustannie na biezaco, abys w ogole mogl z tej pamieci korzystac i nie dostac instant zawal + total data loss :)

Dziękuję za treściwe wyjaśnienie. Popraw mnie proszę jeśli wyciągnąłem złe wnioski z Twojego wykładu:

1. Nic z tym nie mogę zrobić, nie mam na to wpływu
2. Odpytywanie komórek pamięci przez kontroler nie wpływa /nie wpływa znacząco na żywotność samych komórek 3. Odpytywanie komórek pamięci przez kontroler wpływa na żywotność samego kontrolera

I na zakonczenie ciekawy fakt, ten dysk ma 600 TBW Limited Warranty, a wiec mozesz zapisac wszystkie komorki 600 razy kazda po czym tracisz gwarancje. Tak wytrzymale sa te 3 bitowe komorki Samsunga. W porownaniu z SLC (100000 zapisow na komorke) czy krecaca-sie-rdza (spinning rust czyli HDD) - ktory mozesz nadpisywac miliony razy az sie nie rozsypie.

Brany był pod uwagę Crucial MX500, ale ten przy pojemności 1TB ma TBW na poziomie bodajże 350TBW. Jeszcze "weselej" Chciałem duże TBW to sobie kupiłem Adatę SU900 na kościach MLC i TBW 1800... tylko refurb mi się trafił i po 2 latach się zaczął sypać:)) Dobrze, że chociaż kasę oddali, to kupiłem Samsunga.... i jeszcze zostało trochę w kieszeni:(



[1] Samsung nazywa swoje chipy "3bit MLC" co jest totalnie bez sensu, bo 3 bit oznacza TLC, a MLC oznacza 2 bit. Chyba chcieli ukryc fakt w celach marketingowych, ze uzywaja koszmarnych 3 bitowych TLC.

Nie ma innych. MLC teraz ze świecą szukać, a jak znajdziesz... to cena zniechęci do zakupu skutecznie.

I jeszcze jedno na koniec co nie daje mi spokoju: robiąc rozeznanie o co chodzi z tym rzekomo (jak się okazało) wyłączonym AHCI widziałem wiele zrzutów z ekranu Crystal Disk Info różnych dysków SSD z serii EVO (większość o mniejszych pojemnościach) i tam wartości CRC Error Count były bliskie 0 a godzin miały przepracowane sporo więcej. I to mi spokoju nie daje, że może faktycznie jest coś źle u mnie, albo robię jakiś błąd, czegoś nie ustawiłem.

--
t0maszek

<Pop. w Wątku] Aktualny Wątek [Nast. w Wątku>