Gå till innehåll

Koda om tecken på hemsida


Gäst Naturguiden

Recommended Posts

Gäst Naturguiden

Gjorde ett test med denna strängen:

<meta http-equiv="Content-Type" content="text/html; charset=utf-8"/>

och sparade filen som utf-8 i anteckningar och vips så kom ÅÄÖ & åäö fram

tack för alla svar

Nu skall det börjas på en ny hemsida lagomt till det nya året

Visar upp resultatet med en länk senare

Länk till kommentar
Dela på andra webbplatser

Hindi och alla språk med stor teckenuppsättning, som kinesiska, japanska och koreanska, om jag tolkar Wikipedia rätt.

Ja det låter mer logiskt. Med så många bokstäver som kinesiska har så används ju knappast ASCII-delen av UTF-8. UTF-16 måste ju så klart ha en fördel, annars hade man ju inte gjort UTF-16.

Jag sparde en kinesisk text som UTF-8, UTF-16, UTF-32, samt GB18030:

Datum        Tid        Attribut          Bytes    CRC 32  Fil namn

---------- -------- ------  ----------------  -------- --------

2008-12-29 20:50:48 A-----            15 170  2CEEEE3E Daodejing-GB18030.txt

2008-12-29 20:50:04 A-----            17 664  AD650712 Daodejing-UTF-16.txt

2008-12-29 20:50:22 A-----            35 328  F6BCF09B Daodejing-UTF-32.txt

2008-12-29 20:49:39 A-----            21 482  34CEFB76 Daodejing-UTF-8.txt

                          -------------------  --------

                                                    89 644  50ED8B19  4 Filer

Textens innehåll:

Block Name Range Characters Percentage

Basic Latin 000000..00007F 242 3.69

Spacing Modifier Letters 0002B0..0002FF 2 0.03

General Punctuation 002000..00206F 5 0.08

CJK Symbols and Punctuation 003000..00303F 594 9.05

Bopomofo 003100..00312F 7 0.11

CJK Unified Ideographs 004E00..009FFF 5283 80.45

Small Form Variants 00FE50..00FE6F 19 0.29

Halfwidth and Fullwidth Forms 00FF00..00FFEF 415 6.32

Länk till kommentar
Dela på andra webbplatser

Där ser man, men hade du sparat hela alltomvista.se i UTF-8 vs UTF-16, hade UFT-16 blivit dubbelt så stor i stort sett, det finns alltså inget "bästa" och "sämsta", utan man får anpassa sig efter omständigheterna. Själv kör jag fortfarande ASCII i mina program, men UTF-8 på hemsidor nu. ;)

Länk till kommentar
Dela på andra webbplatser

Där ser man, men hade du sparat hela alltomvista.se i UTF-8 vs UTF-16, hade UFT-16 blivit dubbelt så stor i stort sett, det finns alltså inget "bästa" och "sämsta", utan man får anpassa sig efter omständigheterna. Själv kör jag fortfarande ASCII i mina program, men UTF-8 på hemsidor nu. ;)

Att använda annan kodning än Unicode i program går bra, så länge man vänder sig till användare vilkas Windows som standard använder samma kodning (som alternativ till Unicode) som den som används i programmet. Windows är nämligen så dumt att det inte kan identifiera vilken kodning som används i ett icke Unicode-program. Detta har ställt till det bl.a. för kineser som använder t.ex. svenskt eller engelskt Windows, och vill köra ett program som använder annan kodning (GB18030, GB2312, BIG5) än Unicode. Man får då antingen manuellt ställa in en annan kodning i Windows (den används då för alla program som inte använder Unicode), eller använda AppLocale (smidigare).

Länk till kommentar
Dela på andra webbplatser

Delta i dialogen

Du kan skriva svaret nu och registrera dig senare, Om du har ett konto, logga in nu för att svara på inlägget.

Gäst
Svara i detta ämne...

×   Du har klistrat in innehåll med formatering.   Ta bort formatering

  Only 75 emoji are allowed.

×   Din länk har automatiskt bäddats in.   Visa som länk istället

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Skapa nytt...