Lista winnt@man.lodz.pl
[Lista archiwów] [Inne Listy]

Re: [WINNT] notepad - nowy plik ASCII

To: winnt@man.lodz.pl
Subject: Re: [WINNT] notepad - nowy plik ASCII
From: "Arek" <abcdek@poczta.onet.pl.usun_cde.invalid>
Date: Mon, 21 Feb 2022 21:58:15 +0100
Użytkownik "Grzegorz Niemirowski" <grzegorz@grzegorz.net> napisał w
wiadomości news:6212bf42$0$468$65785112@news.neostrada.pl...
Arek <abcdek@poczta.onet.pl.usun_cde.invalid> napisał(a):
W10 domyślnie UTF-8. Po wpisaniu jednej cyferki plik ma długość 1B
(nie ma BOM?) a mimo to otwiera jako UTF-8.

Bo takie ma domyślne zachowanie. Jeśli plik ma tylko znaki ASCII i nie ma
BOM, to można go traktować równie dobrze jako ANSI jak i UTF-8. Notatnik
na XP wybiera pierwszą opcję, Notatnik na 10 wybiera drugą. Świat poszedł
w stronę UTF-8 i ustawienia Notatnika za tym podążyły.

Jeżeli zapisać jako ANSI otwiera jako ANSI.

Na XP. Jak napiszesz jedną łacińską literkę i zapiszesz jako ANSI, to na
Win10 otworzy jako UTF-8.

Jest opcja zapisz jako UTF-8 z BOM i wtedy plik ma rzeczywiście 4 bajty.
Czyli jeszcze gdzieś sobie to zapisuje, gdzie?

Na początku pliku. https://pl.wikipedia.org/wiki/BOM_(informatyka)

Właśnie o to chodziło, że mimo braku BOM otwierał jako ANSI plik
jednoznakowy (cyfra "1") zapisany jako ANSI. To znaczy chyba wydawało
mi się, stąd podejrzenia, że gdzieś jeszcze zapisuje.
Zapewne coś pomyliłem bo teraz otwiera jako UTF. Bez BOM-a próbuje
się domyślić, jeżeli napotka znak, który jako UTF byłby zakodowany
(a nie jest) otwiera jako ANSI.

Bo po przeniesieniu na inny komputer może się krzaczyć, irytujące jest
pamiętanie, żeby przy nowym pliku zapisz jako.

OK, rozumiem że u Ciebie zapisywanie jako ANSI się sprawdza. Niemniej
domyślne używanie UTF-8 nie jest bez przyczyny. Jeśli zapiszesz jako ANSI,
czyli w stronie kodowej swojego systemu, to po otwarciu na systemie z inną
stroną kodową będziesz mieć krzaki. UTF-8 ma właśnie na celu rozwiązanie
problemu ze stronami kodowymi. Po przenieseniu na inny komputer nie musisz
się martwić jaką on ma stronę kodową, krzaków nie będzie. Oczywiście
program otwierający plik na drugim komputerze musi obsługiwać UTF-8, ale
obecnie to jest standard.

Czasem robię coś, gdzie standardem jest "plain text" i bardzo dosłownie
rozumiany WYSIWYG.

Arek


<Pop. w Wątku] Aktualny Wątek [Nast. w Wątku>