|
| 1 | +## 初探集合框架 |
| 2 | + |
| 3 | +眼瞅着三妹的王者荣耀杀得正嗨,我趁机喊到:“别打了,三妹,我们来一起学习 Java 的集合框架吧。” |
| 4 | + |
| 5 | +“才不要呢,等我打完这一局啊。”三妹倔强地说。 |
| 6 | + |
| 7 | +“好吧。”我只好摊摊手地说,“那我先画张集合框架的结构图等着你。” |
| 8 | + |
| 9 | + |
| 10 | + |
| 11 | + |
| 12 | +“完了没?三妹。” |
| 13 | + |
| 14 | +“完了好一会儿了,二哥,你图画得真慢,让我瞧瞧怎么样?” |
| 15 | + |
| 16 | +“害,图要画得清晰明了,不容易的。三妹,你瞧,不错吧。” |
| 17 | + |
| 18 | +Java 集合框架可以分为两条大的支线: |
| 19 | + |
| 20 | +- Collection,主要由 List、Set、Queue 组成,List 代表有序、可重复的集合,典型代表就是封装了动态数组的 ArrayList 和封装了链表的 LinkedList;Set 代表无序、不可重复的集合,典型代表就是 HashSet 和 TreeSet;Queue 代表队列,典型代表就是双端队列 ArrayDeque,以及优先级队列 PriorityQue。 |
| 21 | +- Map,代表键值对的集合,典型代表就是 HashMap。 |
| 22 | + |
| 23 | +“接下来,我们再来过一遍。” |
| 24 | + |
| 25 | +### 01、List |
| 26 | + |
| 27 | +>List 的特点是存取有序,可以存放重复的元素,可以用下标对元素进行操作 |
| 28 | +
|
| 29 | +**1)ArrayList** |
| 30 | + |
| 31 | +- ArrayList 是由数组实现的,支持随机存取,也就是可以通过下标直接存取元素; |
| 32 | +- 从尾部插入和删除元素会比较快捷,从中间插入和删除元素会比较低效,因为涉及到数组元素的复制和移动; |
| 33 | +- 如果内部数组的容易不足时会自动扩容,因此当元素非常庞大的时候,效率会比较低。 |
| 34 | + |
| 35 | +**2)LinkedList** |
| 36 | + |
| 37 | +- LinkedList 是由双向链表实现的,不支持随机存取,只能从一端开始遍历,直到找到需要的元素后返回; |
| 38 | +- 任意位置插入和删除元素都很方便,因为只需要改变前一个节点和后一个节点的引用即可,不像 ArrayList 那样需要复制和移动数组元素; |
| 39 | +- 因为每个元素都存储了前一个和后一个节点的引用,所以相对来说,占用的内存空间会比 ArrayList 多一些。 |
| 40 | + |
| 41 | +**3)Vector 和 Stack** |
| 42 | + |
| 43 | +List 的实现类还有一个 Vector,是一个元老级的类,比 ArrayList 出现得更早。ArrayList 和 Vector 非常相似,只不过 Vector 是线程安全的,像 get、set、add 这些方法都加了 `synchronized` 关键字,就导致执行执行效率会比较低,所以现在已经很少用了。 |
| 44 | + |
| 45 | +更好的选择是并发包下的 CopyOnWriteArrayList。 |
| 46 | + |
| 47 | +Stack 是 Vector 的一个子类,本质上也是由动态数组实现的,只不过还实现了先进后出的功能(在 get、set、add 方法的基础上追加了 pop、peek 等方法),所以叫栈。 |
| 48 | + |
| 49 | +不过,由于 Stack 执行效率比较低(方法上同样加了 synchronized 关键字),就被双端队列 ArrayDeque 取代了。 |
| 50 | + |
| 51 | +### 02、Set |
| 52 | + |
| 53 | +> Set 的特点是存取无序,不可以存放重复的元素,不可以用下标对元素进行操作,和 List 有很多不同 |
| 54 | +
|
| 55 | +**1)HashSet** |
| 56 | + |
| 57 | +HashSet 其实是由 HashMap 实现的,只不过值由一个固定的 Object 对象填充,而键用于操作。 |
| 58 | + |
| 59 | +```java |
| 60 | +public class HashSet<E> |
| 61 | + extends AbstractSet<E> |
| 62 | + implements Set<E>, Cloneable, java.io.Serializable |
| 63 | +{ |
| 64 | + private transient HashMap<E,Object> map; |
| 65 | + |
| 66 | + // Dummy value to associate with an Object in the backing Map |
| 67 | + private static final Object PRESENT = new Object(); |
| 68 | + |
| 69 | + public HashSet() { |
| 70 | + map = new HashMap<>(); |
| 71 | + } |
| 72 | + |
| 73 | + public boolean add(E e) { |
| 74 | + return map.put(e, PRESENT)==null; |
| 75 | + } |
| 76 | + |
| 77 | + public boolean remove(Object o) { |
| 78 | + return map.remove(o)==PRESENT; |
| 79 | + } |
| 80 | +} |
| 81 | +``` |
| 82 | + |
| 83 | +**2)LinkedHashSet** |
| 84 | + |
| 85 | +LinkedHashSet 继承自 HashSet,其实是由 LinkedHashMap 实现的,LinkedHashSet 的构造方法调用了 HashSet 的一个特殊的构造方法: |
| 86 | + |
| 87 | +```java |
| 88 | +HashSet(int initialCapacity, float loadFactor, boolean dummy) { |
| 89 | + map = new LinkedHashMap<>(initialCapacity, loadFactor); |
| 90 | +} |
| 91 | +``` |
| 92 | + |
| 93 | +**3)TreeSet** |
| 94 | + |
| 95 | +“二哥,不用你讲了,我能猜到,TreeSet 是由 TreeMap 实现的,只不过同样操作的键位,值由一个固定的 Object 对象填充。” |
| 96 | + |
| 97 | +哇,三妹都学会了推理。 |
| 98 | + |
| 99 | +“是的,总体上来说,Set 集合不是关注的重点,因为底层都是由 Map 实现的,为什么要用 Map 实现呢?三妹你能猜到原因吗?” |
| 100 | + |
| 101 | +“让我想想。” |
| 102 | + |
| 103 | +“嗯?难道是因为 Map 的键不允许重复、无序吗?” |
| 104 | + |
| 105 | +老天,竟然被三妹猜到了。 |
| 106 | + |
| 107 | +“是的,你这水平长进了呀,三妹。” |
| 108 | + |
| 109 | +### 03、Queue |
| 110 | + |
| 111 | +> Queue,也就是队列,通常遵循先进先出(FIFO)的原则,新元素插入到队列的尾部,访问元素返回队列的头部。 |
| 112 | +
|
| 113 | +**1)ArrayDeque** |
| 114 | + |
| 115 | +从名字上可以看得出,ArrayDeque 是一个基于数组实现的双端队列,为了满足可以同时在数组两端插入或删除元素的需求,数组必须是循环的,也就是说数组的任何一点都可以被看作是起点或者终点。 |
| 116 | + |
| 117 | +这是一个包含了 4 个元素的双端队列,和一个包含了 5 个元素的双端队列。 |
| 118 | + |
| 119 | + |
| 120 | + |
| 121 | +head 指向队首的第一个有效的元素,tail 指向队尾第一个可以插入元素的空位,因为是循环数组,所以 head 不一定从是从 0 开始,tail 也不一定总是比 head 大。 |
| 122 | + |
| 123 | +**2)LinkedList** |
| 124 | + |
| 125 | +LinkedList 一般都归在 List 下,只不过,它也实现了 Deque 接口,可以作为队列来使用。等于说,LinkedList 同时实现了 Stack、Queue、PriorityQueue 的所有功能。 |
| 126 | + |
| 127 | +**3)PriorityQueue** |
| 128 | + |
| 129 | +PriorityQueue 是一种优先级队列,它的出队顺序与元素的优先级有关,执行 remove 或者 poll 方法,返回的总是优先级最高的元素。 |
| 130 | + |
| 131 | +要想有优先级,元素就需要实现 Comparable 接口或者 Comparator 接口。 |
| 132 | + |
| 133 | +### 04、Map |
| 134 | + |
| 135 | +> Map 保存的是键值对,键要求保持唯一性,值可以重复。 |
| 136 | +
|
| 137 | +**1)HashMap** |
| 138 | + |
| 139 | +HashMap 实现了 Map 接口,根据键的 HashCode 值来存储数据,具有很快的访问速度,最多允许一个 null 键。 |
| 140 | + |
| 141 | +HashMap 不论是在学习还是工作当中,使用频率都是相当高的。随着 JDK 版本的不断更新,HashMap 的底层也优化了很多次,JDK 8 的时候引入了红黑树。 |
| 142 | + |
| 143 | +```java |
| 144 | +final V putVal(int hash, K key, V value, boolean onlyIfAbsent, |
| 145 | + boolean evict) { |
| 146 | + HashMap.Node<K,V>[] tab; HashMap.Node<K,V> p; int n, i; |
| 147 | + if ((tab = table) == null || (n = tab.length) == 0) |
| 148 | + n = (tab = resize()).length; |
| 149 | + if ((p = tab[i = (n - 1) & hash]) == null) |
| 150 | + tab[i] = newNode(hash, key, value, null); |
| 151 | + else { |
| 152 | + HashMap.Node<K,V> e; K k; |
| 153 | + if (p.hash == hash && |
| 154 | + ((k = p.key) == key || (key != null && key.equals(k)))) |
| 155 | + e = p; |
| 156 | + else if (p instanceof HashMap.TreeNode) |
| 157 | + e = ((HashMap.TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value); |
| 158 | + else { |
| 159 | + for (int binCount = 0; ; ++binCount) { |
| 160 | + if ((e = p.next) == null) { |
| 161 | + p.next = newNode(hash, key, value, null); |
| 162 | + if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st |
| 163 | + treeifyBin(tab, hash); |
| 164 | + break; |
| 165 | + } |
| 166 | + if (e.hash == hash && |
| 167 | + ((k = e.key) == key || (key != null && key.equals(k)))) |
| 168 | + break; |
| 169 | + p = e; |
| 170 | + } |
| 171 | + } |
| 172 | + return null; |
| 173 | +} |
| 174 | +``` |
| 175 | + |
| 176 | +一旦 HashMap 发生哈希冲突,就把相同键位的地方改成链表,如果链表的长度超过 8,就该用红黑树。 |
| 177 | + |
| 178 | +**2)LinkedHashMap** |
| 179 | + |
| 180 | +大多数情况下,只要不涉及线程安全问题,Map基本都可以使用HashMap,不过HashMap有一个问题,就是迭代HashMap的顺序并不是HashMap放置的顺序,也就是无序。HashMap的这一缺点往往会带来困扰,因为有些场景,我们期待一个有序的Map。 |
| 181 | + |
| 182 | +大多数情况下,只要不涉及到线程安全的问题,有需要键值对的时候就会使用 HashMap,但 HashMap 有一个问题,就是 HashMap 是无序的。在某些场景下,我们需要一个有序的 Map。 |
| 183 | + |
| 184 | +于是 LinkedHashMap 就闪亮登场了。LinkedHashMap 是 HashMap 的子类,内部使用链表来记录插入/访问元素的顺序。 |
| 185 | + |
| 186 | +LinkedHashMap 可以看作是 HashMap + LinkedList 的合体,它使用了 哈希表来存储数据,又用了双向链表来维持顺序。 |
| 187 | + |
| 188 | +**3)TreeMap** |
| 189 | + |
| 190 | +HashMap 是无序的,所以遍历的时候元素的顺序也是不可测的。TreeMap 是有序的,它在内部会对键进行排序,所以遍历的时候就可以得到预期的顺序。 |
| 191 | + |
| 192 | +为了保证顺序,TreeMap 的键必须要实现 Comparable 接口或者 Comparator 接口。 |
| 193 | + |
| 194 | +“好了,三妹,整体上,集合框架就这么多东西了,随后我们会一一展开来讲,比如说 ArrayList、LinkedList、HashMap 等。”我伸了个懒腰后对三妹说。 |
| 195 | + |
| 196 | +“好的,二哥。”三妹重新回答沙发上,一盘王者荣耀即将开始。 |
| 197 | + |
| 198 | +---------- |
0 commit comments