Zeichensatz

aus Wikipedia, der freien Enzyklopädie

Unter einem Zeichensatz versteht man einen Vorrat an Elementen (Zeichen) zur Darstellung von Sachverhalten.

Unter anderem sind dies die Buchstaben eines Alphabetes, sowie Ziffern. Es können aber auch andere grafische Symbole sein, etwa die Sonderzeichen, z. B. die Zeichen der Lautumschrift des IPA-Codes, die Zeichen der Brailleschrift oder Piktogramme verschiedenster Art, sowie Steuerzeichen („unsichtbare Zeichen“).

Die grafische Ausgestaltung eines Zeichens heißt Schriftzeichen, die des ganzen Zeichensatzes Schriftart bzw. Satz, die Regeln der Zeichensetzung Schriftsatz.

In der Computertechnik versteht man unter einem Zeichensatz die Zuordnung der alphanumerischen Zeichen zu einer Zahl. Den Teil der Computerhardware, der die Zeichen auf einem Bildschirm oder auch einem Plotter sichtbar werden lässt, nennt man Zeichengenerator.

Inhaltsverzeichnis

1 Zeichensätze in wissenschaftlichen Formalismen
2 Zeichensätze für Computersysteme
3 Weblinks

[Bearbeiten] Zeichensätze in wissenschaftlichen Formalismen

Typische Zeichensätze sind etwa:

Einheitenzeichen der Einheiten von physikalischen Größen
Formelzeichen und mathematische Symbole

[Bearbeiten] Zeichensätze für Computersysteme

Traditionell in der Informatik bekannte Zeichencodierungen sind der ASCII- und der EBCDIC-Code, insbesondere letzterer hat allerdings stark an Bedeutung verloren. Zunehmend in den Vordergrund getreten sind Zeichensätze mit international notwendigen Zeichen, die über das Englische hinausgehen, z. B. diesbezügliche Zeichensätze gemäß ANSI und insbesondere der international anerkannte Standard Unicode.

Name	Bit	Anzahl definierter Zeichen
ASCII	7	128
EBCDIC	8	192
Unicode	8 bis 32	derzeit 99.000 (Unicode 5.0)

[Bearbeiten] Internationale Zeichensätze

Unicode und ISO/IEC 10646 – Der internationale Standard, auf dem fast alle modernen Computer basieren (1991)
ASCII – Einer der ältesten Computer-Zeichensätze (1963)
ISO/IEC 8859-Familie – Mit 15 verschiedenen Zeichenkodierungen zur Abdeckung aller europäischen Sprachen sowie arabisch, hebräisch, thailändisch und türkisch (1986)
ISO 646 – Definiert nationale ASCII-Varianten in 7 Bit-Kodierung (1972)

[Bearbeiten] Zeichensätze von Computerfirmen

EBCDIC, von IBM entwickelter Zeichensatz (1964)
MacRoman, MacCyrillic und andere proprietäre Zeichensätze für Apple-Mac-Computer vor Mac OS X, welches Unicode verwendet
PETSCII, der Zeichensatz der 8-Bit-Commodore-Computer
Windows- und DOS-Codepages, z. B. Windows-1252 und MS-DOS Codepage 437, Codepage 850
Windows Glyph List 4

[Bearbeiten] Nationale Varianten

ARMSCII – Armenisch
Big5 – Zeichensatz für traditionelle chinesische Schriftzeichen (Taiwan, Auslandschinesen)
DIN 66003 – Deutsch, nationale Variante von ISO 646 (1974)
GEOSTD – Georgisch
Guojia Biaozhun (GB) – Zeichensatz für vereinfachte chinesische Schriftzeichen
HKSCS – Ein Standard aus Hong Kong für kantonesisch (1999)
ISCII – Alle indischen Sprachen
KOI8-R – Russisch
KOI8-U – Ukrainisch
TIS-620 – Thailändisch, ähnlich ISO 8859-11 (1990)
TSCII – Tamil
VISCII – Vietnamesisch
Shift-JIS, auch SJIS – Japanisch, entworfen von Microsoft
EUC (Extended UNIX Coding) – Mehrere ostasiatische Sprachen