See also ebooksgratis.com: no banners, no cookies, totally FREE.

CLASSICISTRANIERI HOME PAGE - YOUTUBE CHANNEL
Privacy Policy Cookie Policy Terms and Conditions
Unicode - Wikipedia

Unicode

Frå Wikipedia – det frie oppslagsverket

Unicode er eit teiknsett som blir vidareutvikla av organisasjonen The Unicode Consortium. Organisasjonen vart stifta i 1991 med det føremål å skape eit standard teiknsett for alle datamaskiner og som støtter alle språk som er i praktisk bruk. Unicode-standarden hadde i versjon 3.1 95221 skriftteikn. Standarden har seinare vorte utvida.

Unicode har fleire kodesett som har sin måte å framstille teikna. I UTF-32 blir det brukt 32 bit per teikn for å representere dagens Unicode-teiknsett, medan teikna i UTF-16, som blir brukt i nyare versjonar av Windows, vert delt opp i porsjoner på 16 bit. I UTF-8 blir Unicodeverdiane overført til ein- eller fleirbyte-sekvensar, etter ein matematisk algoritme. I og med at mange operativsystem (t.d. UNIX) krev 8-bits bytes, er UTF-8 kanskje det viktigaste Unicode-formatet i dag. I tillegg vil ein med UTF-8 kunne spare mykje minne ved handsaming av store mengder tekst, som inneheld hovudsakleg teikn som passar inn i første byten.

Det store fortrinnet med Unicode er at det gjer fleirspråkleg kommunikasjon muleg. Medan ANSI-teiknsetta hindrar brukaren i å skrive på fleire språk innanfor eitt og same dokument, støttar Unicode dei fleste språk.

[endre] Redigeringsprinsipp

Det sentrale prinisppet i Unicode er at standarden skal vere kompatibel med tidlegare versjonar. Unicode har dermed berre ein redigeringsmetode, og det er å leggje til teikn. Viss eit teikn står i Unicode-standarden, blir det ståande der til evig tid. I startfasen vart det lagt til ein ein del teikn som ikkje ville ha komme med i dag.

Unicode er identisk med ISO/IEC-standarden ISO/IEC 10646, og han blir redigert av to ulike komitear, UTC (Unicode Technical committee, med representantar frå dataindustrien, og ulike lingvistar og skriftekspertar), og ISO/IEC JT1 SC2, komiteen for teiknsett. Prosessen å få eit nytt teikn inn i Unicode tar fleire år.

[endre] Historie

Før opprettinga av Unicode-konsortiet satsa ISO på 8-bits teiknsett, den såkalla ISO/IEC 8859-standarden. Her skulle kvar region i verda ha sin eigen kodetabell, der den første halvparten (teikna frå 0 til 127) skulle vere amerikansk ASCII, mens den andre halvparten (frå 128 til256) skulle variere. Skiftinga frå standard til standard var regulert i ein separat standard, ISO 2202. Frå og med 1991 gjekk dei bort frå denne politikken, men i ein overgangsfase vil mange (t.d. i Vest-Europa) framleis bruke 8-bits-standardar.

Unicode har fått kritikk for implementasjonen av kinesiske hàn-tegn (hànzì). Teikna har varierande utsjånad i kinesisk, japansk og koreansk, medan Unicode berre inkluderer teikna éin gong. Samstundes omfattar Unicode fleire vestlige teikn som ser helt like ut i ulike regionar, dette for å gjere seg kompatibel med eldre teiknsett. Eldre versjonar av Unicode mangla òg ein del kinesiske teikn, men dette er til dels vorte korrigert.

[endre] Bakgrunnsstoff



aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -