ebooksgratis.com

See also ebooksgratis.com: no banners, no cookies, totally FREE.

CLASSICISTRANIERI HOME PAGE - YOUTUBE CHANNEL
Privacy Policy Cookie Policy Terms and Conditions
ASCII – Wikipedia

ASCII

Wikipedia

ASCII-merkistö
ASCII-merkistö

ASCII (American Standard Code for Information Interchange) on tietokoneiden merkistö, joka sisältää englannin kielen kirjaimet, numerot, joukon välimerkkejä ja joitakin ohjauskoodeja. Lähes kaikki nykyisin yleisessä käytössä olevat tietokoneiden merkistöt ovat ASCII-yhteensopivia eli niiden 128 ensimmäistä merkkiä ovat samat kuin ASCIIssa.

Sisällysluettelo

[muokkaa] Historiaa

ASCII kehitettiin 1960-luvulla paperille tulostavien kaukokirjoitinlaitteiden ja tietokonepäätteiden merkistöksi ja ohjauskoodistoksi. Aikaisemmat laitteet käyttivät yleensä 5-bittistä Baudot-koodia. ASCIIn kehitti Bob Bemer.

Merkkivalinnat on tehty lähinnä Yhdysvaltojen tarpeen mukaan. Tämä on aiheuttanut jatkuvia ongelmia ei-englanninkielisen tekstin käsittelyssä: esimerkiksi suomen kielen aakkoset A-Z löytyvät kaikista ASCII-merkistön muunnoksista ja näkyvät siis käytännössä aina oikein, mutta niin kutsutut skandimerkit (Å, Ä, Ö) aiheuttavat yllättävän usein yhteensopivuusongelmia vielä nykyäänkin.

[muokkaa] US-ASCII

Ensimmäinen ASCII-määritys julkaistiin vuonna 1968 ANSI X3.4 -standardina. ASCIIsta tuli ISO-standardi vuonna 1972. Alkuperäisessä ISO-646-IRV (international reference version) standardissa dollarin merkin ($) tilalla oli valuuttamerkki (¤). Vuonna 1991 uudistettu versio palasi kuitenkin vallitsevaan käytäntöön ja ISO-646-IRV vastaa nykyään yhdysvaltalaista versiota ISO-646-US eli US-ASCII. ASCII-merkistö on otettu myös Unicode-merkistön pohjaksi ja se muodostaa Unicoden ensimmäisen, Latinalainen perusosa -nimisen lohkon.

ASCII-merkistö määrittelee ensimmäiset 128 merkkiä. Tähän kuuluvat amerikanenglannin isot- ja pienet kirjaimet A–Z, numerot ja joukko sekalaisia erikoismerkkejä (!"#$%&'<>=?.,:;@{[|]}\^_`) . Merkistön alkupäästä on osa varattu erilaisille kontrollikoodeille, joten merkkejä mahtuu merkistöön alle sata erilaista.

US-ASCII ei sisällä Ä- ja Ö-kirjainten kaltaisia Euroopan kielissä tarvittavia merkkejä. Monet kansainväliset kirjaimet sai kuitenkin paperipäätteillä aikaiseksi tulostamalla kaksi merkkiä päällekkäin, esimerkiksi ä = a+¨ ja ñ = n+~. Muutamat US-ASCIIn merkit, kuten ~ ja ^, tarkoitettiinkin nimenomaan tarkkeiksi kansainvälisten kirjainten muodostusta varten, samoin kuin alaviiva (_) tarkoitettiin alleviivausten tuottamiseen. Useamman merkin tulostaminen samaan paikkaan ei kuitenkaan ollut enää näyttöpääteaikana mahdollista, joten viimeistään tässä vaiheessa kansalliset kirjaimet piti saada osaksi varsinaista merkistöä.

Euroopan maissa kansalliset merkit saatiin käyttöön korvaamalla osa erikoismerkeistä muilla merkeillä. Tällaiset merkistöt olivat yleisiä vielä 1980-luvulla, kun käytössä oli vielä paljon näyttöpäätteitä, joiden merkistökoodauksen leveys rajoittui 7 bittiin. Toteutus on kömpelö, etenkin kun päätettä käytettiin ohjelmointiin, jolloin on usein tehtävä valinta skandinaavisten merkkien ja välttämättömien hakasulkujen välillä.

Suomalainen versio merkistöstä (ISO-646-SF) korvasi merkit [\]^ merkeillä ÄÖÅÜ ja {|}~ merkeillä äöåü. @ korvattiin é:llä. Tämä standardi tunnetaan myös suomalaisella nimellä SF-2.

[muokkaa] ASCII-merkistön merkit

| 00 nul| 01 soh| 02 stx| 03 etx| 04 eot| 05 enq| 06 ack| 07 bel|
| 08 bs | 09 ht | 0a nl | 0b vt | 0c np | 0d cr | 0e so | 0f si |
| 10 dle| 11 dc1| 12 dc2| 13 dc3| 14 dc4| 15 nak| 16 syn| 17 etb|
| 18 can| 19 em | 1a sub| 1b esc| 1c fs | 1d gs | 1e rs | 1f us |
| 20 sp | 21  ! | 22  " | 23  # | 24  $ | 25  % | 26  & | 27  ' |
| 28  ( | 29  ) | 2a  * | 2b  + | 2c  , | 2d  - | 2e  . | 2f  / |
| 30  0 | 31  1 | 32  2 | 33  3 | 34  4 | 35  5 | 36  6 | 37  7 |
| 38  8 | 39  9 | 3a  : | 3b  ; | 3c  < | 3d  = | 3e  > | 3f  ? |
| 40  @ | 41  A | 42  B | 43  C | 44  D | 45  E | 46  F | 47  G |
| 48  H | 49  I | 4a  J | 4b  K | 4c  L | 4d  M | 4e  N | 4f  O |
| 50  P | 51  Q | 52  R | 53  S | 54  T | 55  U | 56  V | 57  W |
| 58  X | 59  Y | 5a  Z | 5b  [ | 5c  \ | 5d  ] | 5e  ^ | 5f  _ |
| 60  ` | 61  a | 62  b | 63  c | 64  d | 65  e | 66  f | 67  g |
| 68  h | 69  i | 6a  j | 6b  k | 6c  l | 6d  m | 6e  n | 6f  o |
| 70  p | 71  q | 72  r | 73  s | 74  t | 75  u | 76  v | 77  w |
| 78  x | 79  y | 7a  z | 7b  { | 7c  | | 7d  } | 7e  ~ | 7f del|

[muokkaa] ASCII-merkistön laajennukset

Joskus kuulee puhuttavan "8-bittisestä ASCII-merkistöstä" tai "high-ASCIIsta". Tämä on kuitenkin virheellistä, sillä historiallisesti on ollut käytössä useita keskenään yhteensopimattomia ASCII-laajennuksia. Esimerkiksi MS-DOSin käyttämät merkistöt poikkeavat laajennusmerkkien osalta täysin Windowsin merkistöistä, jotka perustuvat ISO 8859:ään. Yleisin standardoitu kahdeksanbittinen ASCIIn laajennus on ISO 8859-1.

[muokkaa] Katso myös

[muokkaa] Aiheesta muualla


aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -