See also ebooksgratis.com: no banners, no cookies, totally FREE.

CLASSICISTRANIERI HOME PAGE - YOUTUBE CHANNEL
Privacy Policy Cookie Policy Terms and Conditions
Zipfsches Gesetz – Wikipedia

Zipfsches Gesetz

aus Wikipedia, der freien Enzyklopädie

Das Zipf'sche Gesetz (nach George Kingsley Zipf, der dieses Gesetz in den 1930er Jahren aufstellte) ist ein Modell, mit dessen Hilfe man bei bestimmten Größen, die in eine Rangfolge gebracht werden, deren Wert aus ihrem Rang abschätzen kann. Häufige Verwendung findet das Gesetz in der Linguistik, speziell in der Korpuslinguistik und Quantitativen Linguistik, wo es zum Beispiel die Häufigkeit von Wörtern in einem Text zur Rangfolge in Beziehung setzt. Das Zipfsche Gesetz markierte den Beginn der Quantitativen Linguistik.

Ihm liegt ein Potenzgesetz zugrunde, das von der Pareto-Verteilung mathematisch beschrieben wird.

Daneben heißt auch eine Beobachtung zur Sparsamkeit beim Gebrauch einer Sprache (irrtümlicherweise) zipfsches Gesetz (siehe unten)

Inhaltsverzeichnis

[Bearbeiten] Einfache Zipfverteilung

Die vereinfachte Aussage des Zipfschen Gesetzes lautet: Wenn die Elemente einer Menge -- beispielsweise die Worte eines Textes -- nach ihrer Häufigkeit geordnet werden, ist die Wahrscheinlichkeit p ihres Auftretens umgekehrt proportional zur Reihenfolge n:

p(n) ~ 1/n.

Der Normierungsfaktor Summe(1/n) von 1 bis N lässt sich nur für endliche Mengen angeben, da die harmonische Reihe nicht konvergiert. Bei endlichem N gilt:

SN = Summe(1/n) von 1 bis N = (ln(N)+0,577) = (ln(N*1.78)

und damit:

p(n) = 1/n * (1/SN) bzw.
p(n) = 1/(n*ln(N*1.78))

[Bearbeiten] Wahrscheinlichkeitsverteilung

Das Zipfsche Gesetz hat seinen Ursprung in der Linguistik. Es besagt, dass bestimmte Wörter viel häufiger auftreten als andere und die Verteilung einer Hyperbel 1/n ähnelt. Der Ordnungsparameter Rang n lässt sich als kumulative Größe beschreiben: Der Rang n ist gleichbedeutend mit der Anzahl aller Elemente, die genauso groß oder größer sind als n. Für Rang 1 gibt es genau ein Element, nämlich das größte. Für Rang 2 sind es zwei, nämlich das erste und das zweite Element, für 3 drei usw.

Zipf nimmt einen einfachen reziproken Zusammenhang zum Rang an: {}~y(Rang) \sim Rang^{-a}. In der ursprünglichen Form ist das Zipfsche Gesetz frei von Parametern, es ist a = 1.

Die Zipfsche Verteilung entspricht genau der Pareto-Verteilung, unter Vertauschung von Ordinate und Abzisse:

y(x) \sim x^{-a} \mbox{ (Zipf) } \Leftrightarrow x(y) \sim y^{\frac{-1}{a}} \mbox{ (Pareto)}

Sie ist die Umkehrfunktion der Pareto-Verteilung. Wie diese ist sie eine kumulative Verteilungsfunktion, die einem Potenzgesetz gehorcht. Der Exponent e der Verteilungsdichtefunktion lautet entsprechend:

e = 1 + \frac{1}{a}

und für den einfachen Fall a = 1:

e = 2

[Bearbeiten] Beispiele

Zipf-Verteilung der Worthäufigkeiten eines deutschen Textes.
Zipf-Verteilung der Worthäufigkeiten eines deutschen Textes.
Zipf-Buchstabenhäufigkeit eines deutschen Textes.
Zipf-Buchstabenhäufigkeit eines deutschen Textes.

Die Verteilung der Worthäufigkeiten in einem Text, linke Grafik, gehorcht qualitativ einer einfachen Zipfschen Verteilung.

Das Zipfsche Gesetz gibt den Exponenten a der kumulativen Verteilungsfunktion vor: a=1.

Der Fitwert für die Worthäufigkeiten beträgt jedoch a=0.83, gleichbedeutend mit dem Exponenten apareto=1,20 einer Paretoverteilung und dem Exponenten e einer Potenz-Verteilungsdichtefunktion von e=2,20.

Auch die Verteilung der Buchstabenhäufigkeiten ähnelt einer Zipfschen Verteilung. Die Statistik mit 20–30 Buchstaben ist aber zu schlecht, um den Verlauf mit einer Potenzfunktion anzupassen.

Zipf-Verteilung und Messung der Größenverteilung von Städten.
Zipf-Verteilung und Messung der Größenverteilung von Städten.

Ein weiteres Beispiel aus dem Artikel Pareto-Verteilung behandelt die Größenverteilung von Städten. Auch hier findet man eine Abhängigkeit, die einem Potenzgesetz gehorcht. Die Grafik rechts stellt die Zipf-Näherung den Messwerten gegenüber. Der lineare Verlauf in der doppeltlogarithmischen Verteilung stützt die Annahme eines Potenzgesetzes. Anders als die Vermutung von Zipf hat der Exponent nicht den Wert 1, sondern den Wert 0,77, entsprechend einem Exponenten einer Potenzdichteverteilung von e=2,3.

Die Bedeutung der Zipf-Verteilung liegt in der schnellen qualitativen Beschreibung von Verteilungen aus den unterschiedlichsten Bereichen, während die Pareto-Verteilung den Exponenten der Verteilung verfeinert.

Beispielsweise ist die Datenbasis für einen Fit bei der Angabe der Einwohnerzahl von nur 7 Städten zu klein. Das Zipfsche Gesetz liefert eine gute Näherung:

Rang n  Stadt      Einw.   1/Rang  p(n)    p(N)*Menschen   Abweichung
1       Berlin  3522896 1       0,39    3531136,31       -0,23
2       Hamburg 1626220 0,5     0,19    1765568,15       -8,57
3       München 1206683 0,33    0,13    1177045,44        2,46
4       Köln    946280  0,25    0,1     882784,08         6,71
5       Frankft 635150  0,2     0,08    706227,26       -11,19
6       Dortmnd 594058  0,17    0,06    588522,72         0,93
7       Essen   624445  0,14    0,06    504448,04        19,22


Die Schlagworte Potenzgesetz (power law), Skalengesetz oder Selbstorganisation suchen nach Antworten für das Auftreten von Potenzverteilungen.

[Bearbeiten] Das „falsche“ Zipfsche Gesetz zur Sprechökonomie

George Kingsley Zipf hat noch eine Reihe anderer linguistischer Hypothesen als Gesetze formuliert, z.B. zum Zusammenhang zwischen Wortlänge und Worthäufigkeit. Eines davon wird gelegentlich als „falsches“ Zipfsches Gesetz bezeichnet. In der Linguistik gibt es eine als Gesetz formulierte Beobachtung zur Sparsamkeit im Gebrauch von Sprache, die teilweise auch als „Zipfsches Gesetz“ kursiert. Sie hängt kaum mit dem Original zusammen und war auch wohl nicht von George Kingsley Zipf beabsichtigt. Auch wenn der Urheber nicht auszumachen ist, ist auch dieses „Zipfsche“ Gesetz eine wichtige und bedeutende Aussage darüber, wie Sprache entsteht.

Dieses „falsche“ Zipfsche Gesetz besagt, dass Äußerungen in einer Sprache immer aus einem Kompromiss zwischen zwei entgegengesetzten Tendenzen im Sprecher entstehen:

  • einerseits aus dem Wunsch, eine Information möglichst verständlich zu vermitteln, was zu Wiederholung (Redundanz) und Ausführlichkeit führt, und
  • andererseits aus Sparsamkeit, dem Bedürfnis, möglichst wenig physische und geistige Energie bei der Sprachproduktion aufzuwenden.

Dieses Zipfsche Gesetz ist eine Hypothese über die Veränderung von Phonemen innerhalb einer Sprache(n) im Laufe der Zeit (Lautwandel): Durch graduell voranschreitende Anpassungen als Veränderungen bei den gesprochenen Lauten ändert sich ihr Beitrag zur Gesamtinformation, weil sie sich im Zeitablauf dem Lautwert anderer Laute nähern oder sich von ihnen entfernen. Nähert sich ein Laut L1 dem Lautwert des Lauts L2, so wird der Informationswert von L2 immer geringer, was es notwendig macht, auch den Lautwert L2 zu verändern; Annäherung des Lautwerts von L2 an L3 macht Veränderung von L3 notwendig usw. Diese von der Sprechökonomie losgetretene Entwicklung kann in einer durchgreifenden Veränderung vieler Laute im Rahmen eines Dominoeffektes enden und damit sogar Sprachen gleicher Sprachfamilie entfremden (vgl. Deutsch und Niederländisch). Unter der Voraussetzung, dass sich diese Hypothese Zipfs in der Praxis bewährt, könnte sie manchen wichtigen Beitrag in der Phonetik und allgemein der Sprachwandelforschung leisten.

[Bearbeiten] Siehe auch

[Bearbeiten] Literatur

  • Helmut Birkhan: Das „Zipfsche Gesetz“, das schwache Präteritum und die germanische Lautverschiebung, Verl. d. Österr. Akad. d. Wiss., 1979 ISBN 3700102852
  • David Crystal: Die Cambridge Enzyklopädie der Sprache. Campus, Frankfurt/ New York 1993, ISBN 3-593-34824-1
  • X. Gabaix: Zipf's law for cities: An explanation. In: Quarterly Journal of Economics 114 (3): 739-767 AUG 1999
  • Henry Guiter, M.V. Arapov (eds.): Studies on Zipfs Law. Brockmeyer, Bochum 1982, ISBN 3-88339-244-8
  • M. Marsili, Y.C. Zhang: Interacting individuals leading to Zipf's law. In: Physical Review Letters 80 (12): 2741-2744 MAR 23 1998
  • George Kingsley Zipf: The Psycho-Biology of Language. An Introduction to Dynamic Philology. The M.I.T. Press, Cambridge, Mass. 1935/ 1968
  • George Kingsley Zipf: Human Behavior and the Principle of Least Effort. An Introduction to Human Ecology. Addison-Wesley Press, Cambridge, Mass. 1949

[Bearbeiten] Weblinks

Wiktionary
 Wiktionary: Zipfsches Gesetz – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen und Grammatik


aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -