每種程式語言都有集合,最初的Java版本包含幾個集合類別:Vector、Stack、HashTable和Array。隨著集合的廣泛使用,Java1.2提出了囊括所有集合介面、實作和演算法的集合框架。在確保線程安全的情況下使用泛型和並發集合類,Java已經經歷了很長時間。它還包括在Java並發包中,阻塞介面以及它們的實作。集合架構的部分優點如下:
(1)使用核心集合類別降低開發成本,而非實作我們自己的集合類別。
(2)隨著使用經過嚴格測試的集合框架類,程式碼品質會提高。
(3)透過使用JDK附帶的集合類,可以降低程式碼維護成本。
(4)復用性和可操作性。
Java1.5引進了泛型,所有的集合介面和實作都大量使用它。泛型允許我們為集合提供一個可以容納的物件類型,因此,如果你添加其它類型的任何元素,它會在編譯時報錯。這避免了在運行時出現ClassCastException,因為你將會在編譯時得到報錯資訊。泛型也使得程式碼整潔,我們不需要使用明確轉換和instanceOf運算子。它也為運行時帶來好處,因為不會產生類型檢查的字節碼指令。
Collection為集合層級的根介面。一個集合代表一組對象,這些對象就是它的元素。 Java平台不提供這個介面任何直接的實作。
Set是一個不能包含重複元素的集合。這個介面對數學集合抽象進行建模,被用來代表集合,就如一副牌。
List是一個有序集合,可以包含重複元素。你可以透過它的索引來存取任何元素。 List更像長度動態變換的陣列。
Map是一個將key對應到value的物件.一個Map不能包含重複的key:每個key最多只能映射一個value。
一些其它的介面有Queue、Dequeue、SortedSet、SortedMap和ListIterator。
Collection介面指定一組對象,對象即為它的元素。如何維護這些元素由Collection的具體實現決定。例如,一些如List的Collection實作允許重複的元素,而其它的如Set就不允許。很多Collection實作有一個公有的clone方法。然而,把它放到集合的所有實現中也是沒有意義的。這是因為Collection是一個抽象表現。重要的是實現。
當與具體實作打交道的時候,克隆或序列化的語意和意義才發揮作用。所以,具體實現應該決定如何對它進行克隆或序列化,或者它是否可以被克隆或序列化。
在所有的實作中授權克隆和序列化,最終導致更少的靈活性和更多的限制。特定的實作應該決定它是否可以被克隆和序列化。
儘管Map介面和它的實作也是集合框架的一部分,但Map不是集合,集合也不是Map。因此,Map繼承Collection毫無意義,反之亦然。
如果Map繼承Collection接口,那麼元素去哪? Map包含key-value對,它提供抽取key或value清單集合的方法,但它不適合「一組物件」規範。
Iterator介面提供遍歷任何Collection的介面。我們可以從一個Collection中使用迭代器方法來取得迭代器實例。迭代器取代了Java集合框架中的Enumeration。迭代器允許呼叫者在迭代過程中移除元素。
Enumeration的速度是Iterator的兩倍,也使用更少的記憶體。 Enumeration是非常基礎的,也滿足了基礎的需要。但是,與Enumeration相比,Iterator更加安全,因為當一個集合正在被遍歷的時候,它會阻止其它線程去修改集合。
迭代器取代了Java集合框架中的Enumeration。迭代器允許呼叫者從集合中移除元素,而Enumeration不能做到。為了使它的功能更加清晰,迭代器方法名稱已經經過改善。
語意不明,已知的是,Iterator的協定不能確保迭代的次序。然而要注意,ListIterator並沒有提供一個add操作,它要確保迭代的順序。
它可以在目前Iterator的頂層實現,但是它用得很少,如果將它加到介面中,每個繼承都要去實現它,這沒有意義。
(1)我們可以使用Iterator來遍歷Set和List集合,而ListIterator只能遍歷List。
(2)Iterator只可以向前遍歷,而LIstIterator可以雙向遍歷。
(3)ListIterator從Iterator介面繼承,然後增加了一些額外的功能,例如新增一個元素、取代一個元素、取得前面或後面元素的索引位置。
List<String> strList = new ArrayList<>(); //使用for-each循环 for(String obj : strList){ System.out.println(obj); } //using iterator Iterator<String> it = strList.iterator(); while(it.hasNext()){ String obj = it.next(); System.out.println(obj); }
使用迭代器更加線程安全,因為它可以確保,在當前遍歷的集合元素被更改的時候,它會拋出ConcurrentModificationException。
每次我們嘗試取得下一個元素的時候,Iterator fail-fast屬性會檢查目前集合結構裡的任何變更。如果發現任何改動,它會拋出ConcurrentModificationException。 Collection中所有Iterator的實作都是按fail-fast來設計的(ConcurrentHashMap和CopyOnWriteArrayList這類並發集合類別除外)。
Iterator的fail-fast屬性與目前的集合共同作用,因此它不會受到集合中任何改變的影響。 Java.util套件中的所有集合類別都被設計為fail-fast的,而java.util.concurrent中的集合類別都為fail-safe的。 Fail-fast迭代器會拋出ConcurrentModificationException,而fail-safe迭代器從不拋出ConcurrentModificationException。
在遍歷一個集合的時候,我們可以使用並發集合類別來避免ConcurrentModificationException,例如使用CopyOnWriteArrayList,而不是ArrayList。
Iterator介面定義了遍歷集合的方法,但它的實作則是集合實作類別的責任。每個能夠傳回用於遍歷的Iterator的集合類別都有它自己的Iterator實作內部類別。
這就允許集合類別去選擇迭代器是fail-fast還是fail-safe的。例如,ArrayList迭代器是fail-fast的,而CopyOnWriteArrayList迭代器是fail-safe的。
UnsupportedOperationException是用來表示操作不支援的例外。在JDK類別中已被大量運用,在集合框架java.util.Collections.UnmodifiableCollection將會在所有add和remove操作中拋出這個異常。
HashMap在Map.Entry靜態內部類別實作中儲存key-value對。 HashMap使用哈希演算法,在put和get方法中,它使用hashCode()和equals()方法。當我們透過傳遞key-value對呼叫put方法的時候,HashMap使用Key hashCode()和雜湊演算法來找出儲存key-value對的索引。 Entry儲存在LinkedList中,所以如果存在entry,它使用equals()方法來檢查傳遞的key是否已經存在,如果存在,它會覆寫value,如果不存在,它會建立一個新的entry然後儲存。當我們透過傳遞key呼叫get方法時,它再次使用hashCode()來找到數組中的索引,然後使用equals()方法找出正確的Entry,然後傳回它的值。下面的圖片解釋了詳細內容。
其它關於HashMap比較重要的問題是容量、負載係數和閥值調整。 HashMap預設的初始容量是32,負載係數是0.75。閥值是為負載係數乘以容量,無論何時我們嘗試添加一個entry,如果map的大小比閥值大的時候,HashMap會對map的內容進行重新哈希,並且使用更大的容量。容量總是2的冪,所以如果你知道你需要儲存大量的key-value對,例如快取從資料庫裡面拉取的數據,使用正確的容量和負載係數對HashMap進行初始化是個不錯的做法。
HashMap使用Key物件的hashCode()和equals()方法去決定key-value對的索引。當我們試著從HashMap中取得值的時候,這些方法也會被用到。如果這些方法沒有被正確地實現,在這種情況下,兩個不同Key也許會產生相同的hashCode()和equals()輸出,HashMap將會認為它們是相同的,然後覆蓋它們,而不是把它們儲存到不同的地方。同樣的,所有不允許儲存重複資料的集合類別都使用hashCode()和equals()去查找重複,所以正確實作它們非常重要。 equals()和hashCode()的實作應該遵循以下規則:
(1)如果o1.equals(o2),那麼o1.hashCode() == o2.hashCode()總是為true的。
(2)如果o1.hashCode() == o2.hashCode(),并不意味着o1.equals(o2)会为true。
我们可以使用任何类作为Map的key,然而在使用它们之前,需要考虑以下几点:
(1)如果类重写了equals()方法,它也应该重写hashCode()方法。
(2)类的所有实例需要遵循与equals()和hashCode()相关的规则。请参考之前提到的这些规则。
(3)如果一个类没有使用equals(),你不应该在hashCode()中使用它。
(4)用户自定义key类的最佳实践是使之为不可变的,这样,hashCode()值可以被缓存起来,拥有更好的性能。不可变的类也可以确保hashCode()和equals()在未来不会改变,这样就会解决与可变相关的问题了。
比如,我有一个类MyKey,在HashMap中使用它。
//传递给MyKey的name参数被用于equals()和hashCode()中 MyKey key = new MyKey('Pankaj'); //assume hashCode=1234 myHashMap.put(key, 'Value'); // 以下的代码会改变key的hashCode()和equals()值 key.setName('Amit'); //assume new hashCode=7890 //下面会返回null,因为HashMap会尝试查找存储同样索引的key,而key已被改变了,匹配失败,返回null myHashMap.get(new MyKey('Pankaj'));
那就是为何String和Integer被作为HashMap的key大量使用。
Map接口提供三个集合视图:
(1)Set keyset():返回map中包含的所有key的一个Set视图。集合是受map支持的,map的变化会在集合中反映出来,反之亦然。当一个迭代器正在遍历一个集合时,若map被修改了(除迭代器自身的移除操作以外),迭代器的结果会变为未定义。集合支持通过Iterator的Remove、Set.remove、removeAll、retainAll和clear操作进行元素移除,从map中移除对应的映射。它不支持add和addAll操作。
(2)Collection values():返回一个map中包含的所有value的一个Collection视图。这个collection受map支持的,map的变化会在collection中反映出来,反之亦然。当一个迭代器正在遍历一个collection时,若map被修改了(除迭代器自身的移除操作以外),迭代器的结果会变为未定义。集合支持通过Iterator的Remove、Set.remove、removeAll、retainAll和clear操作进行元素移除,从map中移除对应的映射。它不支持add和addAll操作。
(3)Set
(1)HashMap允许key和value为null,而HashTable不允许。
(2)HashTable是同步的,而HashMap不是。所以HashMap适合单线程环境,HashTable适合多线程环境。
(3)在Java1.4中引入了LinkedHashMap,HashMap的一个子类,假如你想要遍历顺序,你很容易从HashMap转向LinkedHashMap,但是HashTable不是这样的,它的顺序是不可预知的。
(4)HashMap提供对key的Set进行遍历,因此它是fail-fast的,但HashTable提供对key的Enumeration进行遍历,它不支持fail-fast。
(5)HashTable被认为是个遗留的类,如果你寻求在迭代的时候修改Map,你应该使用CocurrentHashMap。
对于在Map中插入、删除和定位元素这类操作,HashMap是最好的选择。然而,假如你需要对一个有序的key集合进行遍历,TreeMap是更好的选择。基于你的collection的大小,也许向HashMap中添加元素会更快,将map换为TreeMap进行有序key的遍历。
ArrayList和Vector在很多时候都很类似。
(1)两者都是基于索引的,内部由一个数组支持。
(2)两者维护插入的顺序,我们可以根据插入顺序来获取元素。
(3)ArrayList和Vector的迭代器实现都是fail-fast的。
(4)ArrayList和Vector两者允许null值,也可以使用索引值对元素进行随机访问。
以下是ArrayList和Vector的不同点。
(1)Vector是同步的,而ArrayList不是。然而,如果你寻求在迭代的时候对列表进行改变,你应该使用CopyOnWriteArrayList。
(2)ArrayList比Vector快,它因为有同步,不会过载。
(3)ArrayList更加通用,因为我们可以使用Collections工具类轻易地获取同步列表和只读列表。
Array可以容纳基本类型和对象,而ArrayList只能容纳对象。
Array是指定大小的,而ArrayList大小是固定的。
Array沒有提供ArrayList那麼多功能,像是addAll、removeAll和iterator等。儘管ArrayList明顯是更好的選擇,但也有些時候Array比較好用。
(1)如果清單的大小已經指定,大部分情況下是儲存和遍歷它們。
(2)對於遍歷基本資料類型,儘管Collections使用自動裝箱來減輕編碼任務,在指定大小的基本類型的清單上工作也會變得很慢。
(3)如果你要使用多維數組,使用[][]比List>更容易。
ArrayList和LinkedList兩者都實作了List接口,但是它們之間有些不同。
(1)ArrayList是由Array所支持的基於一個索引的數據結構,所以它提供對元素的隨機訪問,複雜度為O(1),但LinkedList存儲一系列的節點數據,每個節點都與前一個和下一個節點連接。所以,儘管有使用索引取得元素的方法,內部實作是從起始點開始遍歷,遍歷到索引的節點然後回傳元素,時間複雜度為O(n),比ArrayList慢。
(2)與ArrayList相比,在LinkedList中插入、新增和刪除一個元素會更快,因為在一個元素被插入到中間的時候,不會涉及改變陣列的大小,或更新索引。
(3)LinkedList比ArrayList消耗更多的內存,因為LinkedList中的每個節點都儲存了前後節點的引用。
ArrayList、HashMap、TreeMap和HashTable類別提供對元素的隨機存取。
java.util.EnumSet是使用枚舉類型的集合實作。當集合建立時,枚舉集合中的所有元素必須來自單一指定的枚舉類型,可以是顯示的或隱示的。 EnumSet是不同步的,不允許值為null的元素。它也提供了一些有用的方法,例如copyOf(Collection c)、of(E first,E…rest)和complementOf(EnumSet s)。
Vector、HashTable、Properties和Stack是同步類,所以它們是執行緒安全的,可以在多執行緒環境下使用。 Java1.5並發API包括一些集合類,允許迭代時修改,因為它們都工作在集合的克隆上,所以它們在多線程環境中是安全的。
Java1.5並發套件(java.util.concurrent)包含執行緒安全集合類,允許在迭代時修改集合。迭代器被設計為fail-fast的,會拋出ConcurrentModificationException。一部分類為:CopyOnWriteArrayList、 ConcurrentHashMap、CopyOnWriteArraySet。
Java.util.concurrent.BlockingQueue是一個佇列,在進行檢索或移除一個元素的時候,它會等待佇列變成非空;當在新增一個元素時,它會等待佇列中的可用空間。 BlockingQueue介面是Java集合框架的一部分,主要用於實作生產者-消費者模式。我們不需要擔心等待生產者有可用的空間,或消費者有可用的對象,因為它都在BlockingQueue的實作類別中被處理了。 Java提供了集中BlockingQueue的實現,例如ArrayBlockingQueue、LinkedBlockingQueue、PriorityBlockingQueue,、SynchronousQueue等。
堆疊和佇列兩者都被用來預先儲存資料。 java.util.Queue是一個接口,它的實作類別在Java並發包中。佇列允許先進先出(FIFO)檢索元素,但並非總是如此。 Deque介面允許從兩端檢索元素。
堆疊與佇列很相似,但它允許對元素進行後進先出(LIFO)進行檢索。
Stack是一個擴充自Vector的類,而Queue是一個介面。
Java.util.Collections是一個工具類別只包含靜態方法,它們操作或傳回集合。它包含操作集合的多型演算法,傳回一個由指定集合支援的新集合和其它一些內容。這個類別包含集合框架演算法的方法,例如折半搜尋、排序、混編和逆序等。
如果我們想要使用Array或Collection的排序方法時,需要在自訂類別裡實作Java提供Comparable介面。 Comparable介面有compareTo(T OBJ)方法,它被排序方法所使用。我們應該重寫這個方法,如果「this」物件比傳遞的物件參數更小、相等或更大時,它會傳回一個負整數、0或正整數。但是,在大多數實際情況下,我們想要根據不同參數進行排序。例如,身為CEO,我想對僱員基於薪資進行排序,一個HR想基於年齡對他們進行排序。這就是我們需要使用Comparator介面的情景,因為Comparable.compareTo(Object o)方法實作只能基於一個欄位進行排序,我們不能根據物件排序的需求選擇欄位。 Comparator介面的compare(Object o1, Object o2)方法的實作需要傳遞兩個物件參數,若第一個參數比第二個小,則傳回負整數;若第一個等於第二個,則傳回0;若第一個比第二個大,回傳正整數。
Comparable和Comparator介面被用來對物件集合或陣列進行排序。 Comparable介面被用來提供物件的自然排序,我們可以使用它來提供基於單一邏輯的排序。
Comparator介面被用來提供不同的排序演算法,我們可以選擇需要使用的Comparator來對給定的物件集合進行排序。
如果我們需要對一個物件陣列進行排序,我們可以使用Arrays.sort()方法。如果我們需要排序一個物件列表,我們可以使用Collection.sort()方法。兩個類別都有用於自然排序(使用Comparable)或基於標準的排序(使用Comparator)的重載方法sort()。 Collections內部使用陣列排序方法,所有它們兩者都有相同的效能,只是Collections需要花時間將清單轉換為陣列。
在作為參數傳遞之前,我們可以使用Collections.unmodifiableCollection(Collection c)方法建立一個唯讀集合,這將確保改變集合的任何操作都會拋出UnsupportedOperationException。
我們可以使用Collections.synchronizedCollection(Collection c)根據指定集合來取得一個synchronized(線程安全的)集合。
Java集合框架提供常用的演算法實現,例如排序和搜尋。 Collections類別包含這些方法實作。大部分演算法是操作List的,但一部分對所有類型的集合都是可用的。部分演算法有排序、搜尋、混編、最大最小值。
大寫的O描述的是,就資料結構中的一系列元素而言,一個演算法的效能。 Collection類別就是實際的資料結構,我們通常基於時間、記憶體和效能,使用大寫的O來選擇集合實作。例如:範例1:ArrayList的get(index i)是常數時間操作,它不依賴list中元素的數量。所以它的性能是O(1)。範例2:一個對於陣列或列表的線性搜尋的效能是O(n),因為我們需要遍歷所有的元素來找出需要的元素。
(1)根據需要選擇正確的集合類型。例如,如果指定了大小,我們會選用Array而非ArrayList。如果我們想要依照插入順序遍歷一個Map,我們需要使用TreeMap。如果我們不想重複,我們應該使用Set。
(2)一些集合類別允許指定初始容量,所以如果我們能夠估計到儲存元素的數量,我們可以使用它,就避免了重新哈希或大小調整。
(3)基於介面編程,而非基於實作編程,它允許我們後來輕易地改變實作。
(4)總是使用型別安全的泛型,避免在執行時出現ClassCastException。
(5)使用JDK提供的不可變類別作為Map的key,可以避免自己實作hashCode()和equals()。
(6)盡可能使用Collections工具類,或取得唯讀、同步或空的集合,而不是寫自己的實作。它將提供程式碼重用性,它有著更好的穩定性和可維護性。
以上是Java集合面試問題與答案總結的詳細內容。更多資訊請關注PHP中文網其他相關文章!