ASCII er et vanlig brukt tegnsett i datasystemer. I sin opprinnelige utgave inneholdt ASCII-tegnsettet 128 tegn, der blant annet de norske tegnene æ, ø, å, Æ, Ø og Å ikke var med. Disse ble imidlertid lagt inn i den utvidede utgaven.

Faktaboks

Også kjent som
fork. for eng. American Standard Code for Information Interchange

Det opprinnelige tegnsettet ble utviklet på 1960-tallet og standardisert av det som i dag er ANSI (American National Standards Institute). Den opprinnelige utgaven av ASCII var tilpasset å representere tekst med kun engelskspråklige tegn. Det ble likevel raskt en slags standard innen datamaskiner og kommunikasjonsutstyr. Hvert tegn ble representert med 7 bit.

Flere aktører har utviklet utvidede utgaver av ASCII som inneholder 256 tegn. Her er hvert tegn representert med 8 bit i stedet for 7, og man får dobbelt så mange mulige tegn. Hver utgave har de første 128 tegnene felles, men ulike sett med tegn i de neste 128 posisjonene.

For eksempel benyttes ofte Latin-1 (ISO 8859-1) i vesteuropeiske land, mens for eksempel Arabic (ISO-8859-6) er en utvidelse med arabiske tegn. Flere av de ulike utvidelsene er blitt standardisert. Ofte omtales Latin-1 som Extended ASCII, men det korrekte er at Extended ASCII kun refererer til 8-bits tegnsett som utvider det originale 7-bits ASCII, og at flere forskjellige utvidelser av ASCII eksisterer. IBM var var en sentral aktør i å få introdusert de ulike Extended ASCII-formatene på 1980-tallet gjennom sine produkter.

Utfordringen med de mange ulike utvidede tegnsettene er først og fremst at dokumenter må inneholde informasjon om hvilket tegnsett som er i bruk, og at man i mange tilfeller er bundet opp mot kun ett tegnsett i enklere dokumentformater.

ASCII er i dag stort sett erstattet av Unicode, et tegnsett med plass til de fleste brukte tegn og symboler (ca. 1,1 millioner). Unicode er med andre ord et standardisert globalt tegnsett. Første del av Unicode er imidlertid overlappende med ASCII, og man kan derfor også si at ASCII er en delmengde av Unicode eller at Unicode er en videreutvikling av ASCII. Fortsatt brukes ASCII i en del eldre filformater, programmering og systemer.

Eksempler på ASCII-tegn

Hvert tegn i ASCII er knyttet opp mot en numerisk verdi. Her følger noen eksempler:

  • Kontrolltegn: 9 – horisontal tabulator, 10 – line feed (ny linje)
  • Vanlige tegn: 65 – A, 84 – T, 97 – a, 116 – t, 40 – (
  • Utvidet tegnsett (latin-1): 169 – ©, 198 – Æ, 247 – ÷

Les mer i Store norske leksikon

Eksterne lenker

Kommentarer

Kommentarer til artikkelen blir synlig for alle. Ikke skriv inn sensitive opplysninger, for eksempel helseopplysninger. Fagansvarlig eller redaktør svarer når de kan. Det kan ta tid før du får svar.

Du må være logget inn for å kommentere.

eller registrer deg