java ee是什么_死磕 java集合之HashSet源码分析
問題
(1)集合(Collection)和集合(Set)有什么區(qū)別?
(2)HashSet怎么保證添加元素不重復(fù)?
(3)HashSet是否允許null元素?
(4)HashSet是有序的嗎?
(5)HashSet是同步的嗎?
(6)什么是fail-fast?
簡介
集合,這個(gè)概念有點(diǎn)模糊。
廣義上來講,java中的集合是指java.util包下面的容器類,包括和Collection及Map相關(guān)的所有類。
中義上來講,我們一般說集合特指java集合中的Collection相關(guān)的類,不包含Map相關(guān)的類。
狹義上來講,數(shù)學(xué)上的集合是指不包含重復(fù)元素的容器,即集合中不存在兩個(gè)相同的元素,在java里面對(duì)應(yīng)Set。
具體怎么來理解還是要看上下文環(huán)境。
比如,面試別人讓你說下java中的集合,這時(shí)候肯定是廣義上的。
再比如,下面我們講的把另一個(gè)集合中的元素全部添加到Set中,這時(shí)候就是中義上的。
HashSet是Set的一種實(shí)現(xiàn)方式,底層主要使用HashMap來確保元素不重復(fù)。
源碼分析
屬性
// 內(nèi)部使用HashMapprivate transient HashMap<E,Object> map;// 虛擬對(duì)象,用來作為value放到map中private static final Object PRESENT = new Object();構(gòu)造方法
public HashSet() {map = new HashMap<>(); }public HashSet(Collection<? extends E> c) {map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));addAll(c); }public HashSet(int initialCapacity, float loadFactor) {map = new HashMap<>(initialCapacity, loadFactor); }public HashSet(int initialCapacity) {map = new HashMap<>(initialCapacity); }// 非public,主要是給LinkedHashSet使用的 HashSet(int initialCapacity, float loadFactor, boolean dummy) {map = new LinkedHashMap<>(initialCapacity, loadFactor); }構(gòu)造方法都是調(diào)用HashMap對(duì)應(yīng)的構(gòu)造方法。
最后一個(gè)構(gòu)造方法有點(diǎn)特殊,它不是public的,意味著它只能被同一個(gè)包或者子類調(diào)用,這是LinkedHashSet專屬的方法。
添加元素
直接調(diào)用HashMap的put()方法,把元素本身作為key,把PRESENT作為value,也就是這個(gè)map中所有的value都是一樣的。
public boolean add(E e) {return map.put(e, PRESENT)==null; }刪除元素
直接調(diào)用HashMap的remove()方法,注意map的remove返回是刪除元素的value,而Set的remov返回的是boolean類型。
這里要檢查一下,如果是null的話說明沒有該元素,如果不是null肯定等于PRESENT。
public boolean remove(Object o) {return map.remove(o)==PRESENT; }查詢?cè)?/h3>
Set沒有g(shù)et()方法哦,因?yàn)間et似乎沒有意義,不像List那樣可以按index獲取元素。
這里只要一個(gè)檢查元素是否存在的方法contains(),直接調(diào)用map的containsKey()方法。
public boolean contains(Object o) {return map.containsKey(o); }遍歷元素
直接調(diào)用map的keySet的迭代器。
public Iterator<E> iterator() {return map.keySet().iterator(); }全部源碼
package java.util;import java.io.InvalidObjectException; import sun.misc.SharedSecrets;public class HashSet<E>extends AbstractSet<E>implements Set<E>, Cloneable, java.io.Serializable {static final long serialVersionUID = -5024744406713321676L;// 內(nèi)部元素存儲(chǔ)在HashMap中private transient HashMap<E,Object> map;// 虛擬元素,用來存到map元素的value中的,沒有實(shí)際意義private static final Object PRESENT = new Object();// 空構(gòu)造方法public HashSet() {map = new HashMap<>();}// 把另一個(gè)集合的元素全都添加到當(dāng)前Set中// 注意,這里初始化map的時(shí)候是計(jì)算了它的初始容量的public HashSet(Collection<? extends E> c) {map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));addAll(c);}// 指定初始容量和裝載因子public HashSet(int initialCapacity, float loadFactor) {map = new HashMap<>(initialCapacity, loadFactor);}// 只指定初始容量public HashSet(int initialCapacity) {map = new HashMap<>(initialCapacity);}// LinkedHashSet專用的方法// dummy是沒有實(shí)際意義的, 只是為了跟上上面那個(gè)操持方法簽名不同而已HashSet(int initialCapacity, float loadFactor, boolean dummy) {map = new LinkedHashMap<>(initialCapacity, loadFactor);}// 迭代器public Iterator<E> iterator() {return map.keySet().iterator();}// 元素個(gè)數(shù)public int size() {return map.size();}// 檢查是否為空public boolean isEmpty() {return map.isEmpty();}// 檢查是否包含某個(gè)元素public boolean contains(Object o) {return map.containsKey(o);}// 添加元素public boolean add(E e) {return map.put(e, PRESENT)==null;}// 刪除元素public boolean remove(Object o) {return map.remove(o)==PRESENT;}// 清空所有元素public void clear() {map.clear();}// 克隆方法@SuppressWarnings("unchecked")public Object clone() {try {HashSet<E> newSet = (HashSet<E>) super.clone();newSet.map = (HashMap<E, Object>) map.clone();return newSet;} catch (CloneNotSupportedException e) {throw new InternalError(e);}}// 序列化寫出方法private void writeObject(java.io.ObjectOutputStream s)throws java.io.IOException {// 寫出非static非transient屬性s.defaultWriteObject();// 寫出map的容量和裝載因子s.writeInt(map.capacity());s.writeFloat(map.loadFactor());// 寫出元素個(gè)數(shù)s.writeInt(map.size());// 遍歷寫出所有元素for (E e : map.keySet())s.writeObject(e);}// 序列化讀入方法private void readObject(java.io.ObjectInputStream s)throws java.io.IOException, ClassNotFoundException {// 讀入非static非transient屬性s.defaultReadObject();// 讀入容量, 并檢查不能小于0int capacity = s.readInt();if (capacity < 0) {throw new InvalidObjectException("Illegal capacity: " +capacity);}// 讀入裝載因子, 并檢查不能小于等于0或者是NaN(Not a Number)// java.lang.Float.NaN = 0.0f / 0.0f;float loadFactor = s.readFloat();if (loadFactor <= 0 || Float.isNaN(loadFactor)) {throw new InvalidObjectException("Illegal load factor: " +loadFactor);}// 讀入元素個(gè)數(shù)并檢查不能小于0int size = s.readInt();if (size < 0) {throw new InvalidObjectException("Illegal size: " +size);}// 根據(jù)元素個(gè)數(shù)重新設(shè)置容量// 這是為了保證map有足夠的容量容納所有元素, 防止無意義的擴(kuò)容capacity = (int) Math.min(size * Math.min(1 / loadFactor, 4.0f),HashMap.MAXIMUM_CAPACITY);// 再次檢查某些東西, 不重要的代碼忽視掉SharedSecrets.getJavaOISAccess().checkArray(s, Map.Entry[].class, HashMap.tableSizeFor(capacity));// 創(chuàng)建map, 檢查是不是LinkedHashSet類型map = (((HashSet<?>)this) instanceof LinkedHashSet ?new LinkedHashMap<E,Object>(capacity, loadFactor) :new HashMap<E,Object>(capacity, loadFactor));// 讀入所有元素, 并放入map中for (int i=0; i<size; i++) {@SuppressWarnings("unchecked")E e = (E) s.readObject();map.put(e, PRESENT);}}// 可分割的迭代器, 主要用于多線程并行迭代處理時(shí)使用public Spliterator<E> spliterator() {return new HashMap.KeySpliterator<E,Object>(map, 0, -1, 0, 0);} }總結(jié)
(1)HashSet內(nèi)部使用HashMap的key存儲(chǔ)元素,以此來保證元素不重復(fù);
(2)HashSet是無序的,因?yàn)镠ashMap的key是無序的;
(3)HashSet中允許有一個(gè)null元素,因?yàn)镠ashMap允許key為null;
(4)HashSet是非線程安全的;
(5)HashSet是沒有g(shù)et()方法的;
彩蛋
(1)阿里手冊(cè)上有說,使用java中的集合時(shí)要自己指定集合的大小,通過這篇源碼的分析,你知道初始化HashMap的時(shí)候初始容量怎么傳嗎?
我們發(fā)現(xiàn)有下面這個(gè)構(gòu)造方法,很清楚明白地告訴了我們?cè)趺粗付ㄈ萘俊?/p>
假如,我們預(yù)估HashMap要存儲(chǔ)n個(gè)元素,那么,它的容量就應(yīng)該指定為((n/0.75f) + 1),如果這個(gè)值小于16,那就直接使用16得了。
初始化時(shí)指定容量是為了減少擴(kuò)容的次數(shù),提高效率。
public HashSet(Collection<? extends E> c) {map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));addAll(c); }(2)什么是fail-fast?
fail-fast機(jī)制是java集合中的一種錯(cuò)誤機(jī)制。
當(dāng)使用迭代器迭代時(shí),如果發(fā)現(xiàn)集合有修改,則快速失敗做出響應(yīng),拋出ConcurrentModificationException異常。
這種修改有可能是其它線程的修改,也有可能是當(dāng)前線程自己的修改導(dǎo)致的,比如迭代的過程中直接調(diào)用remove()刪除元素等。
另外,并不是java中所有的集合都有fail-fast的機(jī)制。比如,像最終一致性的ConcurrentHashMap、CopyOnWriterArrayList等都是沒有fast-fail的。
那么,fail-fast是怎么實(shí)現(xiàn)的呢?
細(xì)心的同學(xué)可能會(huì)發(fā)現(xiàn),像ArrayList、HashMap中都有一個(gè)屬性叫modCount,每次對(duì)集合的修改這個(gè)值都會(huì)加1,在遍歷前記錄這個(gè)值到expectedModCount中,遍歷中檢查兩者是否一致,如果出現(xiàn)不一致就說明有修改,則拋出ConcurrentModificationException異常。
歡迎關(guān)注我的公眾號(hào)“彤哥讀源碼”,查看更多源碼系列文章, 與彤哥一起暢游源碼的海洋。
總結(jié)
以上是生活随笔為你收集整理的java ee是什么_死磕 java集合之HashSet源码分析的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
 
                            
                        - 上一篇: android时间最大,Android
- 下一篇: svm算法原理_机器学习——分类算法(1
