Arek <abcdek@poczta.onet.pl.usun_cde.invalid> napisał(a):
W10 domyślnie UTF-8. Po wpisaniu jednej cyferki plik ma długość 1B
(nie ma BOM?) a mimo to otwiera jako UTF-8.
Bo takie ma domyślne zachowanie. Jeśli plik ma tylko znaki ASCII i nie ma
BOM, to można go traktować równie dobrze jako ANSI jak i UTF-8. Notatnik na
XP wybiera pierwszą opcję, Notatnik na 10 wybiera drugą. Świat poszedł w
stronę UTF-8 i ustawienia Notatnika za tym podążyły.
Jeżeli zapisać jako ANSI otwiera jako ANSI.
Na XP. Jak napiszesz jedną łacińską literkę i zapiszesz jako ANSI, to na
Win10 otworzy jako UTF-8.
Jest opcja zapisz jako UTF-8 z BOM i wtedy plik ma rzeczywiście 4 bajty.
Czyli jeszcze gdzieś sobie to zapisuje, gdzie?
Na początku pliku. https://pl.wikipedia.org/wiki/BOM_(informatyka)
Bo po przeniesieniu na inny komputer może się krzaczyć, irytujące jest
pamiętanie, żeby przy nowym pliku zapisz jako.
OK, rozumiem że u Ciebie zapisywanie jako ANSI się sprawdza. Niemniej
domyślne używanie UTF-8 nie jest bez przyczyny. Jeśli zapiszesz jako ANSI,
czyli w stronie kodowej swojego systemu, to po otwarciu na systemie z inną
stroną kodową będziesz mieć krzaki. UTF-8 ma właśnie na celu rozwiązanie
problemu ze stronami kodowymi. Po przenieseniu na inny komputer nie musisz
się martwić jaką on ma stronę kodową, krzaków nie będzie. Oczywiście program
otwierający plik na drugim komputerze musi obsługiwać UTF-8, ale obecnie to
jest standard.
--
Grzegorz Niemirowski
https://www.grzegorz.net/
|