Startseite | News | Suchen | Archiv | Sprachriff | About

Archiv Artikel - Essays - Sprachriff

Zipfsches Gesetz – Gesetzmässigkeiten der Quantitativen Linguistik und mehr

Verfasst von Urs Scheidegger |

Ursprünglich stammt das Zipfsche Gesetz aus der Linguistik und wird dort verwendet, um die Verteilung der Worthäufigkeit in Texten zu beschreiben. Konkret besagt es, dass sich die Häufigkeit eines Wortes in einem Textkorpus zu seinem Rang in der Häufigkeitstabelle umgekehrt proportional verhält. Mittlerweile findet das Zipfsche Gesetz in zahlreichen anderen Bereichen Anwendung – zurecht und missverständlich.

Das Zipfsche Gesetz, benannt nach dem amerikanischen Psychologen George K. Zipf (1902-1950), hat seinen Ursprung in der Sprachwissenschaft, genauer in der Quantitativen Linguistik, wo Buchstaben, Wörter, Sätze und anderes mehr mit Methoden der Statistik untersucht werden. Die einfachste Formulierung des Zipf-Gesetzes besagt, dass sich die Auftrittswahrscheinlichkeit eines Begriffes in einem Text umgekehrt proportional zur Position des Begriffs in einer Rangliste der Häufigkeiten verhält. Als Formel: p(n) ~ 1/n, wobei p die Auftrittswahrscheinlichkeit ist und n die Position in der Häufigkeitsrangliste. Oder anders formuliert: Je häufiger ein Begriff in einer Reihe von Begriffen auftaucht, desto höher ist auch die Auftrittswahrscheinlichkeit für diesen Begriff. Es beschreibt ein statistisches Modell, bei dem die Auftrittswahrscheinlichkeit von Elementen aus einer Reihe von Elementen durch deren Rang in der Häufigkeitsliste bestimmt werden kann.

 

Verkaufszahlen aller Art bis Waldbränden und Erdbeben
Mittlerweile gibt es allerhand andere Phänomene, die sich gemäss dem Zipfschen Gesetz beschreiben lassen. Darunter beispielsweise die Verkaufszahlen von Büchern, DVDs, Schuhen oder Tickets aller Art, die Grösse von Unternehmen, die Häufigkeitsverteilung von Website-Besuchen oder von Zitierungen wissenschaftlicher Aufsätze, die Verteilung der Vermögen und Einkommen, Fluktuationen auf Finanzmärkten, die Häufigkeitsverteilung von Waldbränden, Vulkanausbrüchen und Erdbeben oder die Art und Weise, wie genetische Informationen in Proteine übersetzt werden.


Das Benfordsche Gesetz – ein Spezialfall des Zipfschen Gesetzes
Ein Spezialfall des Zipfschen Gesetzes ist das Benfordsche Gesetz, welches sich mit der Häufigkeit von Zahlen befasst. Tatsächlich beginnen die meisten längeren Zahlenfolgen mit einer eins. Die zweithäufigste Anfangsziffer ist die zwei, die dritthäufigste die drei etc. Benford zeigte die Gültigkeit dieser Verteilung für diverse Zusammenhänge, zum Beispiel Bilanzen, die Länge von Flüssen und die Bevölkerung amerikanischer Ortschaften.
Diese Gesetze sind «skaleninvariant» – es macht also keinen Unterschied, ob Flüsse in Meilen oder Metern oder Bilanzen in Dollar oder Euro angegeben werden.

 

Archiv - © Urs Scheidegger 1995 - 2024

***