Lexikalische Dichte

Die lexikalische Dichte ist ein Maß in der Linguistik, besonders in der Computerlinguistik, das den Anteil der Inhaltswörter an der Gesamtzahl aller Wörter in Prozent angibt. Der Begriff leitet sich vom englischen Ausdruck für Inhaltswörter, Vorlage:Lang, her. Inhaltswörter sind diejenigen Wörter, die eine eigene lexikalische Bedeutung haben. Ihnen gegenüber stehen die Funktionswörter, die überwiegend grammatikalische Bedeutung tragen.

Die lexikalische Dichte kann nach folgender Formel berechnet werden:

L D = \frac{N_{lexikalisch}}{N_{gesamt}} \cdot 100

Die Skalierung auf Werte zwischen 0 und 100 ist nicht notwendig und wird nicht immer vorgenommen, insbesondere wenn man die lexikalischen Wörter nicht ins Verhältnis zur Gesamtzahl der Wörter setzt, sondern zur Anzahl an grammatikalischen Einheiten, wie beispielsweise Teilsätzen. Außerdem ist eine Gewichtung der lexikalischen Wörter je nach Häufigkeit in der Sprache möglich.

Das Maß wurde von Jean Ure zur Beschreibung von Registervariation eingeführt. Auch Michael Halliday stellte fest, dass die lexikalische Dichte im Gesprochenen geringer ist als bei geschriebener Sprache. Die lexikalische Dichte kann zur Textanalyse in der forensischen Linguistik (unter anderem Plagiarismuserkennung) angewendet werden.

Literatur

Lexikalische Dichte

Literatur

Navigationsmenü

Suche