本文由 ImportNew - 唐小娟 翻譯自 Javarevisited。如需轉(zhuǎn)載本文,請先參見文章末尾處的轉(zhuǎn)載要求。 HashMap的工作原理是近年來常見的Java面試題。幾乎每個Java程序員都知道HashMap,都知道哪里要用HashMap,知道HashTable和HashMap之間的區(qū)別,那么為何這道面試題如此特殊呢?是因為這道題考察的深度很深。這題經(jīng)常出現(xiàn)在高級或中高級面試中。投資銀行更喜歡問這個問題,甚至?xí)竽銓崿F(xiàn)HashMap來考察你的編程能力。ConcurrentHashMap和其它同步集合的引入讓這道題變得更加復(fù)雜。讓我們開始探索的旅程吧! 先來些簡單的問題“你用過HashMap嗎?” “什么是HashMap?你為什么用到它?” 幾乎每個人都會回答“是的”,然后回答HashMap的一些特性,譬如HashMap可以接受null鍵值和值,而HashTable則不能;HashMap是非synchronized;HashMap很快;以及HashMap儲存的是鍵值對等等。這顯示出你已經(jīng)用過HashMap,而且對它相當(dāng)?shù)氖煜?。但是面試官來個急轉(zhuǎn)直下,從此刻開始問出一些刁鉆的問題,關(guān)于HashMap的更多基礎(chǔ)的細節(jié)。面試官可能會問出下面的問題: “你知道HashMap的工作原理嗎?” “你知道HashMap的get()方法的工作原理嗎?” 你也許會回答“我沒有詳查標(biāo)準(zhǔn)的Java API,你可以看看Java源代碼或者Open JDK?!薄拔铱梢杂肎oogle找到答案?!?/p> 但一些面試者可能可以給出答案,“HashMap是基于hashing的原理,我們使用put(key, value)存儲對象到HashMap中,使用get(key)從HashMap中獲取對象。當(dāng)我們給put()方法傳遞鍵和值時,我們先對鍵調(diào)用hashCode()方法,返回的hashCode用于找到bucket位置來儲存Entry對象?!边@里關(guān)鍵點在于指出,HashMap是在bucket中儲存鍵對象和值對象,作為Map.Entry。這一點有助于理解獲取對象的邏輯。如果你沒有意識到這一點,或者錯誤的認為僅僅只在bucket中存儲值的話,你將不會回答如何從HashMap中獲取對象的邏輯。這個答案相當(dāng)?shù)恼_,也顯示出面試者確實知道hashing以及HashMap的工作原理。但是這僅僅是故事的開始,當(dāng)面試官加入一些Java程序員每天要碰到的實際場景的時候,錯誤的答案頻現(xiàn)。下個問題可能是關(guān)于HashMap中的碰撞探測(collision detection)以及碰撞的解決方法: “當(dāng)兩個對象的hashcode相同會發(fā)生什么?” 從這里開始,真正的困惑開始了,一些面試者會回答因為hashcode相同,所以兩個對象是相等的,HashMap將會拋出異常,或者不會存儲它們。然后面試官可能會提醒他們有equals()和hashCode()兩個方法,并告訴他們兩個對象就算hashcode相同,但是它們可能并不相等。一些面試者可能就此放棄,而另外一些還能繼續(xù)挺進,他們回答“因為hashcode相同,所以它們的bucket位置相同,‘碰撞’會發(fā)生。因為HashMap使用LinkedList存儲對象,這個Entry(包含有鍵值對的Map.Entry對象)會存儲在LinkedList中?!边@個答案非常的合理,雖然有很多種處理碰撞的方法,這種方法是最簡單的,也正是HashMap的處理方法。但故事還沒有完結(jié),面試官會繼續(xù)問: “如果兩個鍵的hashcode相同,你如何獲取值對象?” 面試者會回答:當(dāng)我們調(diào)用get()方法,HashMap會使用鍵對象的hashcode找到bucket位置,然后獲取值對象。面試官提醒他如果有兩個值對象儲存在同一個bucket,他給出答案:將會遍歷LinkedList直到找到值對象。面試官會問因為你并沒有值對象去比較,你是如何確定確定找到值對象的?除非面試者直到HashMap在LinkedList中存儲的是鍵值對,否則他們不可能回答出這一題。 其中一些記得這個重要知識點的面試者會說,找到bucket位置之后,會調(diào)用keys.equals()方法去找到LinkedList中正確的節(jié)點,最終找到要找的值對象。完美的答案! 許多情況下,面試者會在這個環(huán)節(jié)中出錯,因為他們混淆了hashCode()和equals()方法。因為在此之前hashCode()屢屢出現(xiàn),而equals()方法僅僅在獲取值對象的時候才出現(xiàn)。一些優(yōu)秀的開發(fā)者會指出使用不可變的、聲明作final的對象,并且采用合適的equals()和hashCode()方法的話,將會減少碰撞的發(fā)生,提高效率。不可變性使得能夠緩存不同鍵的hashcode,這將提高整個獲取對象的速度,使用String,Interger這樣的wrapper類作為鍵是非常好的選擇。 如果你認為到這里已經(jīng)完結(jié)了,那么聽到下面這個問題的時候,你會大吃一驚。“如果HashMap的大小超過了負載因子(load factor)定義的容量,怎么辦?”除非你真正知道HashMap的工作原理,否則你將回答不出這道題。默認的負載因子大小為0.75,也就是說,當(dāng)一個map填滿了75%的bucket時候,和其它集合類(如ArrayList等)一樣,將會創(chuàng)建原來HashMap大小的兩倍的bucket數(shù)組,來重新調(diào)整map的大小,并將原來的對象放入新的bucket數(shù)組中。這個過程叫作rehashing,因為它調(diào)用hash方法找到新的bucket位置。 如果你能夠回答這道問題,下面的問題來了:“你了解重新調(diào)整HashMap大小存在什么問題嗎?”你可能回答不上來,這時面試官會提醒你當(dāng)多線程的情況下,可能產(chǎn)生條件競爭(race condition)。 當(dāng)重新調(diào)整HashMap大小的時候,確實存在條件競爭,因為如果兩個線程都發(fā)現(xiàn)HashMap需要重新調(diào)整大小了,它們會同時試著調(diào)整大小。在調(diào)整大小的過程中,存儲在LinkedList中的元素的次序會反過來,因為移動到新的bucket位置的時候,HashMap并不會將元素放在LinkedList的尾部,而是放在頭部,這是為了避免尾部遍歷(tail traversing)。如果條件競爭發(fā)生了,那么就死循環(huán)了。這個時候,你可以質(zhì)問面試官,為什么這么奇怪,要在多線程的環(huán)境下使用HashMap呢?:) 熱心的讀者貢獻了更多的關(guān)于HashMap的問題:
我個人很喜歡這個問題,因為這個問題的深度和廣度,也不直接的涉及到不同的概念。讓我們再來看看這些問題設(shè)計哪些知識點:
總結(jié)HashMap的工作原理HashMap基于hashing原理,我們通過put()和get()方法儲存和獲取對象。當(dāng)我們將鍵值對傳遞給put()方法時,它調(diào)用鍵對象的hashCode()方法來計算hashcode,讓后找到bucket位置來儲存值對象。當(dāng)獲取對象時,通過鍵對象的equals()方法找到正確的鍵值對,然后返回值對象。HashMap使用LinkedList來解決碰撞問題,當(dāng)發(fā)生碰撞了,對象將會儲存在LinkedList的下一個節(jié)點中。 HashMap在每個LinkedList節(jié)點中儲存鍵值對對象。 當(dāng)兩個不同的鍵對象的hashcode相同時會發(fā)生什么? 它們會儲存在同一個bucket位置的LinkedList中。鍵對象的equals()方法用來找到鍵值對。 因為HashMap的好處非常多,我曾經(jīng)在電子商務(wù)的應(yīng)用中使用HashMap作為緩存。因為金融領(lǐng)域非常多的運用Java,也出于性能的考慮,我們會經(jīng)常用到HashMap和ConcurrentHashMap。你可以查看更多的關(guān)于HashMap和HashTable的文章。 -- 掃描加關(guān)注,微信號: importnew -- ![]() 原文鏈接: Javarevisited 翻譯: ImportNew.com - 唐小娟 譯文鏈接: http://www./7099.html [ 轉(zhuǎn)載請保留原文出處、譯者、譯文鏈接和上面的微信二維碼圖片。] 相關(guān)文章
|
|
來自: yetao_study > 《Java》