Digraph (Linguistik)
aus Wikipedia, der freien Enzyklopädie
Digraph bezeichnet in der Graphematik zwei Buchstaben, die für eine Lautung stehen. Für mehr als zwei Buchstaben verwendet man Trigraph, Tetragraph und so fort.
Inhaltsverzeichnis |
[Bearbeiten] Begriffsbestimmung
Im weiteren Sinne ist ein Digraph zwei Grapheme, die sich einem Phonem zuordnen lassen (z. B. die Konsonantenbuchstabenkombination ng im Deutschen dem Phonem /ŋ/). Ebenso als Digraph wird eine Buchstabenkombination bezeichnet, die sich einer Phonemkombination zuordnen lässt, wenn deren Bestandteile nicht eindeutig und getrennt voneinander auf die Bestandteile der Buchstabenkombination bezogen sind (z. B. ch im Englischen der Phonemkombination /tʃ/ – es wäre nicht sinnvoll, das c dem /t/ und das h dem /ʃ/ zuzuordnen).
Manchmal wird der Begriff auch nicht in diesem phonographischen Sinne gebraucht. In einem phonemunabhängigen graphematischen Ansatz, der aber (aus distributionellen Gründen) davon ausgeht, dass ein Graphem aus mehreren Buchstaben (Graphen/Glyphen) bestehen kann (und z. B. ch und qu als jeweils ein Graphem bewertet), wird Digraph als Bezeichnung für solch ein Graphem verwendet (ohne dass damit schon etwas über die Zuordnung zu Phonemen gesagt wäre).
Im engeren Sinne sind Digraphen die Buchstabenpaare, die in einer Sprache als so eng zusammengehörig betrachtet werden, dass sie zum Beispiel auch bei der alphabetischen Sortierung wie ein Buchstabe behandelt werden. Dieser Gebrauch des Begriffes kann aber vom ersten abweichen. Die Vorkommen in der alphabetischen Sortierung garantiert noch nicht, dass es sich bei der zugehörigen Lautung um ein Phonem (oder eine Phonemkombination im obigen Sinne) handelt. (Es lässt sich z. B. darüber streiten, ob dž im Kroatischen ein Digraph im ersten Sinne ist. Das hängt auch von der vorausgesetzten Phonemdefinition ab. Wenn man /dʒ/ im Kroatischen als zwei Phoneme wertet, lassen sich die Bestandteile der Laut- und Buchstabenkombination eindeutig zuordnen – d zu /d/ und ž zu /ʒ/ –, und dž ist dann genauso wenig ein Digraph wie z. B. dr.)
[Bearbeiten] Trigraph, Tetragraph, …
Entsprechend wird der Begriff Trigraph (zu griechisch tri-, „drei“, siehe Griechische Zahlwörter) für eine Kombination aus drei Buchstaben gebraucht (z. B. sch im Deutschen und Schwedischen für das Phonem /ʃ/, ieh im Deutschen für /i:/). Die Reihe lässt sich beliebig fortsetzen: Tetragraph (tetra- „vier“), z. B. ough im Englischen für /ɔ:/ in brought, zsch für /tʃ/ in Eigennamen wie Zschopau), Pentagraph (penta- „fünf“) etwa tzsch für /tʃ/ in Eigennamen wie Nietzsche) usw. Als Heptagraph (hepta- „sieben“) lässt sich schtsch zur Transkription des russischen Graphems „щ“ bezeichnen, wenn man davon ausgeht, dass im modernen Russisch dieses Graphem als ein Phonem /ʃʲ:/ (früher /ʃʲtʃʲ/) gesprochen wird.
[Bearbeiten] Verwendung in Umschriften
Digraphen und Mehrfachkombinationen werden auch für die Transliteration und Transkription anderer Sprachen verwendet, etwa zh, sh im Englischen für die „sch“-Laute (Frikative) /ʒ, ʃ/.
Außerdem dienen sie vielfach der Darstellung von diakritischen Zeichen (vgl. tschech. č, ř mit poln. cz, rz), wenn diese selbst etwa aus technischen Gründen nicht zur Verfügung stehen.
Die lateinischen Buchstaben sind, auch wegen der Verbreitung des Ascii-Zeichensatzes in der elektronischen Datenverarbeitung, allgemein für Umschriften verbreitet (engl. latinisation oder romanisation). Auch andere Schriftsysteme verwenden ein analoges Vorgehen, wie die traditionelle chinesische Laut-Umschrift Fǎnqiè (z. B. chin. 德红, dī-jīng für die Lautung dīng des Zeichens 丁).
[Bearbeiten] Beispiele
Beispiele für Mehrgraphe (und andere Buchstabenkombinationen):
1. Mehrgraphe (für einen Laut), deren Aussprache sich synchron nicht oder nur teilweise aus der Aussprache der Einzelbuchstaben begründen lässt,
2. Mehrgraphe (für einen Laut), deren Aussprache sich aus einer in der jeweiligen Sprache geltenden, allgemeinen Ausspracheregel für die Kombination der Einzelbuchstaben ergibt (produktive, potenziell reihenbildende Regel),
3. Mehrgraphe und andere besondere Buchstabenverbindungen für Lautkombinationen (für Diphthonge, Affrikaten und andere), deren Aussprache sich nicht aus einer in der jeweiligen Sprache geltenden, allgemeinen Ausspracheregel für die Kombination der Einzelbuchstaben ergibt.
(Mehrgraphe/Buchstabenkombinationen mit einem eigenen Platz im Alphabet sind kursiv gesetzt.)
- Albanisch
- dh, gj, ll, nj, rr, sh, th, xh, zh
- Dänisch vor 1948 und in Eigennamen
- aa
- Deutsch
- 1. ch, sch, ph, ng, ie, ou, (nur als Ersatz für ä, ö, ü, ß und in Eigennamen:) ae, oe, ue, sz; 2. bb, dd, ff, ..., ss, ck, tz, dt, aa, ee, oo, ah, äh, eh, ih, ..., th, gh, dh, ..., (nur in unbetonter Silbe:) el, em, en, er; 3. äu, ei, eu, chs, dsch, (nur in Eigennamen:) zsch, (nur am Stammanfang:) sp und st, (nur im Wortinnern vor Vokal:) ti, (nur am unbetonten Wortende:) ig
- I-Kiribati
- ng
- Kroatisch, Serbisch (lateinische Schrift)
- dž;, lj, nj
- Kurdisch
- xw
- Niederländisch
- ij
- Polnisch
- ch, cz, sz, rz, dz, dż, dź
- Schwedisch
- 1. sj, tj, sch, ng, (nur am Stammanfang:) dj, gj, hj, kj, lj, skj, stj, (nur am Stammanfang vor e, i, y, ä, ö:) sk, (nur im Wortinnern vor Vokal, außer i:) ti, si, ssi; 2. bb, dd, ff, ..., ck, rd, rl, rn, rs, rt; 3. (nur zwischen Vokalen und am Wortende:) gn
- Spanisch
- ch, ll
- Tschechisch
- ch, dž
- Ungarisch
- 1. gy, ly, ny, ty, sz, zs, (nur in Eigennamen:) eö; 2. bb, cc, dd, ff, ..., ggy, ssz, ..., (nur in Eigennamen:) cz; 3. cs
[Bearbeiten] Zeichenkodierung
Unicode hat aus Kompatibilitätsgründen einigen wenigen lateinischen Digraphen eigene Codes zugewiesen:
U+01C6 | U+01C9 | U+01CC | U+01F3 | Position |
---|---|---|---|---|
dž | lj | nj | dz | Darstellung als Digraph |
dž | lj | nj | dz | Einzelbuchstaben |