Gå till innehåll

Koda om tecken på hemsida


Gäst Naturguiden

Recommended Posts

Gäst Naturguiden

Hur skall jag göra om det blir tomma fyrkanter på en hemsida när jag gör ÅÄÖ,åäö

Är det ändring i html koden som krävs eller måste man formatera bokstäverna

Länk till kommentar
Dela på andra webbplatser

  • 2 månader senare...

Nej nej nej...

Det hela beror på att du har sparat din html-fil med en viss teckentabell, och sen inte tolkar filen med samma teckentabell. Lösningen ni ger är egentligen helt fel, eftersom den inte alls löser problemet, utan mer bara lappar ihop det lite löst.

Allt du behöver göra är att ta reda på med vilken teckentabell du sparar din fil med (Står ofta i den rutan där du väljer var du ska spara din fil), och sen lägga till denna raden mellan <head></head>:

<meta http-equiv="Content-Type" content="text/html; charset=teckentabellen_här">

Då kan du skriva åäö och det kommer tolkas rätt på alla webbläsare.

Detta gör diverse editeringsprogram automatiskt (frontpage, dreamweaver, expression web osv...)

Vill lägga till att detta är den riktiga lösningen på alla dessa fel, i alla kategorier.

Länk till kommentar
Dela på andra webbplatser

Gäst Naturguiden
Nej nej nej...

Det hela beror på att du har sparat din html-fil med en viss teckentabell, och sen inte tolkar filen med samma teckentabell. Lösningen ni ger är egentligen helt fel, eftersom den inte alls löser problemet, utan mer bara lappar ihop det lite löst.

Allt du behöver göra är att ta reda på med vilken teckentabell du sparar din fil med (Står ofta i den rutan där du väljer var du ska spara din fil), och sen lägga till denna raden mellan <head></head>:

<meta http-equiv="Content-Type" content="text/html; charset=teckentabellen_här">

Då kan du skriva åäö och det kommer tolkas rätt på alla webbläsare.

Detta gör diverse editeringsprogram automatiskt (frontpage, dreamweaver, expression web osv...)

Vill lägga till att detta är den riktiga lösningen på alla dessa fel, i alla kategorier.

Jag funderar på hur du får reda på vilken teckentabell man egentligen har:

Nu står det:

<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" />

I mina html dokument

Länk till kommentar
Dela på andra webbplatser

Man kan inte ta reda på vad man har sparat sidan med för teckentabell, du måste veta det själv.

Om du använder en bra editor behöver du aldrig tänka på det här, men vilket program använder du för att spara och ändra i dina filer med?

Länk till kommentar
Dela på andra webbplatser

Jag kör anteckningar

Kanske man skall ändra och köra på något nytt

Okej då är problemet löst :)

Du har förmodligen börjat göra sidan i något annat program, som då skrivit en teckentabell i meta-taggen, och sen har du ändrat i anteckningar som då sparat med en annan teckentabell. Kör du antecknignar ska du använda denna metan:

<meta http-equiv="Content-Type" content="text/html; charset=Windows-1252">

Windows-1252 är svenska och lite annat nordiskt ;)

Länk till kommentar
Dela på andra webbplatser

Det är iso-8859-1 (Latin-1) också.

F.ö. beklagligt att dessa begränsa(n)de kodningar alltjämt används. UTF-16 känns ju en aning modernare och rymligare…

Anteckningar använder Windows-1252 som standard, vilket är en 8-bitars teckentabell som inte är samma som ISO-8859-1. Alltså ska man skriva att man använder Windows-1252 i sin meta-tagg, som jag tidigare sa.

Sen så är det inte alls beklagligt att använda dessa teckentabeller. Denna tabellen har hela det svenska alfabetet plus massor av andra tecken, alltså allt man behöver om man är svensk.

Att använda den teckentabellen du föreslog, UTF-16, vilken är en 16-bitars teckentabell skulle i det här fallet vara idiotiskt, eftersom varje bokstav då blir dubbelt så stor som med Windows-1252.

Sen vill jag bara förtydliga lite; att använda Windows-1252 betyder inte att hemsidan inte kommer gå att läsa i t. ex. kina. Den kommer gå att läsa i exakt hela världen, men man kan bara skriva svenska tecken på sin sida, vilket är precis vad Naturguiden ville göra.

Länk till kommentar
Dela på andra webbplatser

Anteckningar använder Windows-1252 som standard, vilket är en 8-bitars teckentabell som inte är samma som ISO-8859-1.

Jag påstod heller inte att de vore samma, men båda omfattar det du nämnde. ;)

Sen så är det inte alls beklagligt att använda dessa teckentabeller. Denna tabellen har hela det svenska alfabetet plus massor av andra tecken, alltså allt man behöver om man är svensk.

Det är högst beklagligt, och du beskrev just varför: ”om man är svensk”. Ja, då räcker en 8-bitarskodning, så länge man skriver på svenska, och inte har behov av andra tecken än dem som ingår i svenska (rättare: västeuropeiska) teckenuppsättningen. Som språkhistoriker och fonetiker har jag sett 8-bitarskodning ställa till så många problem, och 16-bitars Unicode lösa dem alla, att jag skyr 8-bitarseländet som pesten. ;)

Att använda den teckentabellen du föreslog, UTF-16, vilken är en 16-bitars teckentabell skulle i det här fallet vara idiotiskt, eftersom varje bokstav då blir dubbelt så stor som med Windows-1252.

Och? Man kan ju använda UTF-8 också…

Sen vill jag bara förtydliga lite; att använda Windows-1252 betyder inte att hemsidan inte kommer gå att läsa i t. ex. kina. Den kommer gå att läsa i exakt hela världen, men man kan bara skriva svenska tecken på sin sida, vilket är precis vad Naturguiden ville göra.

Sämsta användningen av annan kodning än Unicode torde vara webbmail. Om jag skickar e-post på svenska, kodad som UTF-8 eller Windows-1252, och den öppnas i en webbmailsida som använder någan annan kodning, blir det skräp av å, ä, ö… Om användaren byter kodning i webbläsaren, så att mitt meddelande visas rätt, kommer resten av sidan att knasig istället. Beklagligt att vi inte lämnade dessa problem för gott 1991, du Unicode-standarden lanserades, eller åtminstone 1993, då Windows NT lanserades. Utvecklingen går verkligen långsamt på vissa områden. ::)

Länk till kommentar
Dela på andra webbplatser

Använder alltid UTF-8, det är enda vettiga du kan göra om du använder Anteckningar, eller använd annan editor.

Använd till exempel strängen nedan mellan <head> och </head>

<meta http-equiv="Content-Type" content="text/html; charset=utf-8"/>

Sen spar du bara dina dokument som UTF-8 i Anteckningar. Mer än så behöver du inte göra.

Länk till kommentar
Dela på andra webbplatser

Använder alltid UTF-8, det är enda vettiga du kan göra om du använder Anteckningar, eller använd annan editor.

Använd till exempel strängen nedan mellan <head> och </head>

<meta http-equiv="Content-Type" content="text/html; charset=utf-8"/>

Sen spar du bara dina dokument som UTF-8 i Anteckningar. Mer än så behöver du inte göra.

Bästa svaret i tråden. Jag skrev att man skulle använda utf-8, som JoWa sa innan men forumhaveriet tog bort meddelandena.

Helt enkelt gäller det att tala om vad man använder för kodning, och när man ändå gör det kan man passa på att använda utf-8 vilket sopar mattan med allt annat ;)

Länk till kommentar
Dela på andra webbplatser

Bästa svaret i tråden. Jag skrev att man skulle använda utf-8, som JoWa sa innan men forumhaveriet tog bort meddelandena.

Helt enkelt gäller det att tala om vad man använder för kodning, och när man ändå gör det kan man passa på att använda utf-8 vilket sopar mattan med allt annat ;)

...och det var just vad som var poängen med min länk till webdesignskolan.... men den var det väl ingen som orkade läsa.  ::)

Länk till kommentar
Dela på andra webbplatser

utf-8 vilket sopar mattan med allt annat ;)

Allt utom UTF-16 och UTF-32! ;D

offtopic.gif

Synd att fonter är begränsade till 16-bitarskodning. Unicode-standarden omfattar nu över 100 000 tecken, och det går inte ens att göra en font med alla kinesiska tecken som ingår i standarden. :'(

Länk till kommentar
Dela på andra webbplatser

Bästa svaret i tråden. Jag skrev att man skulle använda utf-8, som JoWa sa innan men forumhaveriet tog bort meddelandena.

Helt enkelt gäller det att tala om vad man använder för kodning, och när man ändå gör det kan man passa på att använda utf-8 vilket sopar mattan med allt annat ;)

...och det var just vad som var poängen med min länk till webdesignskolan.... men den var det väl ingen som orkade läsa.   ::)

Jo jag läste den lite, men det känns onödigt att behöva läsa typ 3-4 A4 sidor för att komma fram till att man bara behöver ändra till utf-8, och om man vill, lägga till metataggen med utf-8 satt.

Länk till kommentar
Dela på andra webbplatser

utf-8 vilket sopar mattan med allt annat ;)

Allt utom UTF-16 och UTF-32! ;D

offtopic.gif

Synd att fonter är begränsade till 16-bitarskodning. Unicode-standarden omfattar nu över 100 000 tecken, och det går inte ens att göra en font med alla kinesiska tecken som ingår i standarden. :'(

Men vänta nu.. UTF-8 är väl ändå bättre. Wikipedia använder UTF-8 och den tar ju bara 8-bitar, men kan ändå representera hela Unicode, eftersom den växer när den behöver. UTF-16 är väl något som alltid är minst 16-bitar och då blir ju alla text dubbel så stor att lagra.

Har inte helt greppat alla UTF-erna men detta verkar galet?

Alltså egentligen är ju 8-bitars ASCII det bästa om man bara ska skriva svenska. Den tar absolut minst utrymme och kan ändå representera 256 tecken vilket räcker väl till svenskan. UTF-8 är ju lite av en lyx där man har det bästa av båda världarna (lättvikten av ASCII men omfånget av Unicode). När man går iväg till UTF-16 och dem får det väl ändå räcka :)

Länk till kommentar
Dela på andra webbplatser

Jo jag läste den lite, men det känns onödigt att behöva läsa typ 3-4 A4 sidor för att komma fram till att man bara behöver ändra till utf-8, och om man vill, lägga till metataggen med utf-8 satt.

Att lära sig nya saker, kan ALDRIG vara onödigt! Kunskap är en lätt börda att bära!    ;)

Länk till kommentar
Dela på andra webbplatser

Men vänta nu.. UTF-8 är väl ändå bättre. Wikipedia använder UTF-8 och den tar ju bara 8-bitar, men kan ändå representera hela Unicode, eftersom den växer när den behöver. UTF-16 är väl något som alltid är minst 16-bitar och då blir ju alla text dubbel så stor att lagra.

Har inte helt greppat alla UTF-erna men detta verkar galet?

Alltså egentligen är ju 8-bitars ASCII det bästa om man bara ska skriva svenska. Den tar absolut minst utrymme och kan ändå representera 256 tecken vilket räcker väl till svenskan. UTF-8 är ju lite av en lyx där man har det bästa av båda världarna (lättvikten av ASCII men omfånget av Unicode). När man går iväg till UTF-16 och dem får det väl ändå räcka :)

Detta Wikipedia-citat kanske är intressant i sammanhanget:

De första 128 kodtecknen behöver bara en byte. Med två bytes kan UTF-8 representera 1920 olika kodtecken, med tre oktetter ryms 63488 teckenkoder (kodpunkter upp till 65536 / U+FFFF), 2048 surrogatkoder undantagna), och med fyra bytes kan alla övriga kodpunkter (utom surrogatkodpunkter) representeras.

Exempel på skriftsystem som kräver två bytes per tecken i UTF-8 är (de flesta) latinska tecken, grekiska, kyrilliska, armenska, hebreiska och arabiska. Därmot behöver japanska, kinesiska, koreanska, thailändska med flera språk tre bytes per tecken.

UTF-8 ger mindre filer än UTF-16 för alla språk som kräver max två bytes per tecken, eftersom det alltid finns blanktecken, komma med mera som kräver 1 byte. Text med latinskt alfabet ger mycket mindre filer än UTF-16 och obetydligt mer än 8-bitskodningar, eftersom de flesta bokstäver blir i intervallet A-Z. Däremot kräver många öst- och sydasiatiska språk mer utrymme för UTF-8 än andra kodningar. Särskilt i Indien har det varit kritik mot det då de hittills använt en egen 8-bitskodning som bara varit gjord för hindi och engelska. UTF-8 tar tre gånger så mycket minnesutrymme för hindi.

Länk till kommentar
Dela på andra webbplatser

UTF-8 ger mindre filer än UTF-16 för alla språk som kräver max två bytes per tecken, eftersom det alltid finns blanktecken, komma med mera som kräver 1 byte. Text med latinskt alfabet ger mycket mindre filer än UTF-16 och obetydligt mer än 8-bitskodningar, eftersom de flesta bokstäver blir i intervallet A-Z.

VS

UTF-8 tar tre gånger så mycket minnesutrymme för hindi.

Ja det är en hel vetenskap det här, men som det står så är det i stort sett bara för hindi som det lönar sig att använda mer än UTF-8, men det är ju fortfarande möjligt att använda UTF-8, så i stora drag (där man skriver mer i andra språk än hindi) är UTF-8 bättre.

och obetydligt mer än 8-bitskodningar

Här är ju lite av det jag menar: även om UTF-8 är jävligt ballt så är ju alltid ASCII den som tar minst, den kan bara ha 256 tecken, men å andra sidan tar ett tecken bara en byte - alltid.

Nej men jag skulle satsa mina pengar på UTF-8, den kodningen är precis vad internet behöver.

Länk till kommentar
Dela på andra webbplatser

Ja det är en hel vetenskap det här,

Hehe, ja, inte helt lätt att bli klok på alla detaljer… ;)

men som det står så är det i stort sett bara för hindi som det lönar sig att använda mer än UTF-8, men det är ju fortfarande möjligt att använda UTF-8, så i stora drag (där man skriver mer i andra språk än hindi) är UTF-8 bättre.

Hindi och alla språk med stor teckenuppsättning, som kinesiska, japanska och koreanska, om jag tolkar Wikipedia rätt.

Länk till kommentar
Dela på andra webbplatser

Hindi och alla språk med stor teckenuppsättning, som kinesiska, japanska och koreanska, om jag tolkar Wikipedia rätt.

Ja det låter mer logiskt. Med så många bokstäver som kinesiska har så används ju knappast ASCII-delen av UTF-8. UTF-16 måste ju så klart ha en fördel, annars hade man ju inte gjort UTF-16.

Länk till kommentar
Dela på andra webbplatser

Delta i dialogen

Du kan skriva svaret nu och registrera dig senare, Om du har ett konto, logga in nu för att svara på inlägget.

Gäst
Svara i detta ämne...

×   Du har klistrat in innehåll med formatering.   Ta bort formatering

  Only 75 emoji are allowed.

×   Din länk har automatiskt bäddats in.   Visa som länk istället

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Skapa nytt...