Java - Collection Basic & Hash Basic

선입선출(FIFO) 방식을 사용하며 선언 시에 LinkedList<>로 구현체를 만드는 것이 일반적이다.
그러나 우선순위에 따라 요소를 관리하는 PriorityQueue<>나, 큐의 두 끝에서 요소를 추가하거나 제거할 수 있는 ArrayDeque<>로 상황따라 선언하기도 한다.
offer() 와 poll() 그리고 peak() 등의 메서드가 있다.

일반적으로 데이터를 고정된 크기의 값으로 변환하는 알고리즘 또는 함수를 의미한다.
key와 Value로 나뉘어져 있으며, Key를 가지고 Value를 찾는 방식이다.
Map에서 하나의 Key, Value가 저장되어있는 공간을 버킷이라고 한다.
HashTable, HashMap, ConcurrentHashMap 등이 있다.
- HashTable은 Null을 허용하지 않고, 현재는 별로 사용하지 않는다. 동기화는 지원하지만 성능이 좋지 않다.
- HashMap은 Null을 허용하고, 일반적으로 많이 쓰인다. 그러나 동기화를 지원하지 않아 멀티 스레드 환경에서는 적합하지 않다.
- ConcurrentHashMap은 Null도 지원하고 동기화도 지원한다. 내부에서 데이터를 관리하는데 해시 버킷을 분할하여 여러 섹션으로 나누어 동시성을 향상시킨다.

Hash는 Key값을 hashcode로 먼저 비교를 한 후 equals로 비교를 한다.
이 때 둘 다 같으면, 아예 동일한 Key로 간주하고 값을 덮어씌운다거나 한다.
그러나 hashcode는 같고, equals 만 다른 경우가 있다.
hashcode 는 기본적으로 오버라이딩 되어있지 않다면, 기본으로 제공하는 해시 함수의 결과로 hashcode 를 만든다.
HashMap 은 그 hashcode 값의 버킷에 value 를 저장한다.
예를들어, value % 3 == index 이라는 해시 함수를 재정의 하였다.
그러면, value 가 3 인 녀석과, 6인 녀석은 모두 0 이라는 index를 갖게되고,
index 0 에 3과 6이 들어가고자 충돌하게 된다.
이 때 자바에서는 노드 갯수가 8개가 되기 전까지는 LinkedList 로 관리해준다.
- 즉, index 0 에는 3이 있고, 그 뒤에는 6이 있다 이런 식으로 관리를 해주는 것이다.
- 그러다가 노드 갯수가 8개가 되면 Red-Black Tree 구조로 저장하게 된다.
- 그러다가 다시 노드가 삭제되어 갯수가 6개가 되면 LinkedList 로 돌아온다.
  - 둘 다 기준점이 8개면, 그 경계선에서 불필요한 자료구조가 겹치게 일어날 수 있기 때문이다.

Set과 Map 에서는 로드 팩터를 기반으로 해당 객체의 저장 공간을 조절한다.
Set과 Map 에서는 로드 팩터를 기반으로 해당 객체의 저장 공간을 조절한다. 로드 팩터는 기본적으로 (데이터의 개수)/ (저장 공간) 을 의미하며, 이를 기반으로 Map과 Set의 크기를 리사이즈 한다.
기본적으로 부여되는 Map 공간 크기는 16이다.
초기에 생성자를 통해 초기 공간 크기와 로드 팩터를 정해줄 수 있다.
들어오는 데이터에 비해 로드 팩터가 작을 경우 해시 충돌 및 링크드 리스트를 통한 Separate Chaining이 많이 발생한다. 반대로, 들어오는 데이터에 비해 로드 팩터가 클 경우 메모리 낭비가 발생한다. 따라서 이를 고려하여 설정해야 한다. 일반적으로 0.75의 로드 팩터를 설정하는 것을 이상적으로 생각한다.

우리가 hashCode 를 만드는 함수를 재정의 할 때,
- 계산 속도가 빠른 것
- 결과 값이 균등 하게 분포 되는 것
- 어떤 입력 값도 지정된 길이의 츨력 값으로 바꿀 수 있을 것
- 일방향성을 띌 것
이 부분을 고려하여 만들어야 한다.
이미 존재하는 해시함수 알고리즘이 여러개가 있다. 거기서 선택하는 것이 가장 좋다.

results matching ""