Divisionsrestmethode

Die Divisionsrestmethode (siehe auch Modulo) liefert eine Hashfunktion.

Die Funktion lautet: $h (k) = k mod m$

$m$ ist die Größe der Hashtabelle.

Eigenschaften

Die Hash-Funktion kann sehr schnell berechnet werden
Die Wahl der Tabellengröße $m$ beeinflusst die Kollisionswahrscheinlichkeit der Funktionswerte von $h$ .

Für die meisten Eingabedaten ist zum Beispiel die Wahl einer Zweierpotenz für $m$ , also $m = 2^{i}$ , ungeeignet, da dies der Extraktion der $i$ -niedrigstwertigen Bits von $k$ entspricht, so dass alle höherwertigen Bits bei der Hash-Berechnung ignoriert werden.

Für praxisrelevante Anwendungen liefert die Wahl einer Primzahl für $m$ , welche keine Mersenne-Primzahl ist, eine geringe Anzahl von zu erwartenden Kollisionen bei vielen Eingabedatenverteilungen.^[1]

Hashing von Zeichenketten

Zeichenketten können mit der Divisionsmethode gehasht werden, indem sie in ganze Zahlen zur Basis $b$ umgewandelt werden, wobei $b$ die Zeichensatzgröße bezeichnet.

Um Integer-Überläufe zu vermeiden, kann für die Berechnung des Hashwertes bei Schlüsseln das Horner-Schema angewendet werden. Das folgende Beispiel zeigt eine Berechnung eines Hashwertes für eine 7-Bit-ASCII-Zeichenkette $s$ .

$k mod m = (\dots (s_{1} \cdot 128 + s_{2}) mod m) \cdot 128 + s_{3}) mod m) \cdot 128 + \dots + s_{l - 1}) mod m) \cdot 128 + s_{l}) mod m$

Somit kann als Zwischenergebnis maximal $(m - 1) \cdot 128 + 127$ auftreten.

Dargestellt in Pseudocode:

Parameter: natürliche Zahlen i, h=0; Feld s
 for i = 0 to i < länge_von(s)
	h = (h * 128 + s[i]) mod m;
Ergebnis: h.

Die Multiplikation mit 128 = 2^7 entspricht der Links-Bit-Shift-Operation << 7.

Literatur

Donald E. Knuth: The Art of Computer Programming. Band 3: Sorting and Searching. 2nd edition. Addison-Wesley, Upper Saddle River NJ unter anderem 1998, ISBN 0-201-89685-0, S. 515.

Einzelnachweise

↑ Vorlage:Literatur

[1] Vorlage:Literatur

[1]

Divisionsrestmethode

Inhaltsverzeichnis

Eigenschaften

Hashing von Zeichenketten

Literatur

Einzelnachweise

Navigationsmenü

Divisionsrestmethode

Eigenschaften

Hashing von Zeichenketten

Literatur

Einzelnachweise

Navigationsmenü

Suche