素数が hashCode() の計算に好まれる理由
Java では、素数は、関数の hashCode() メソッドで頻繁に使用されます。 Eclipse を使用して hashCode() メソッドを生成する際の素数 31 の一般的な使用法で例示されるように、クラス。この選択は、パターン化された入力を使用するシナリオであっても、ハッシュ バケット間でのデータの最適な分散を確保する必要性から生じています。
素数の基本的な特性は、データを均等に分散する傾向があり、値をハッシュにマッピングする際の衝突を最小限に抑えます。バケツ。入力の分布がランダムかつ均一である場合、ハッシュ コードまたはモジュラスの特定の選択は重要ではありません。ただし、メモリ位置を扱う場合など、入力に識別可能なパターンがある場合は、法として素数を使用すると、分散を大幅に改善できます。
すべての 32 ビット整数が次のように配置される例を考えてみましょう。 4 で割り切れるアドレス。以下の表は、素数モジュラス (7) を使用した場合と非素数モジュラスを使用した場合の影響を示しています。 (8):
Input | Modulo 8 | Modulo 7 |
---|---|---|
0 | 0 | 0 |
4 | 4 | 4 |
8 | 0 | 1 |
12 | 4 | 5 |
16 | 0 | 2 |
20 | 4 | 6 |
24 | 0 | 3 |
28 | 4 | 0 |
表からわかるように、素数係数を使用した分布は、非素数係数を使用した場合に比べてかなり均一であり、衝突の可能性が最小限に抑えられます。
要約すると、素数係数の選択は、ランダムで均一に分散された入力では重要ではありませんが、パターン化された入力を扱う場合には重要になります。素数を利用することで、開発者はハッシュ関数の有効性を高め、ハッシュベースのデータ構造における最適なデータ分散と効率的なパフォーマンスを確保できます。
以上がJava の hashCode() メソッドで素数が使用されるのはなぜですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。