본문 바로가기

CS 면접 준비

[CS 면접 준비 - 7] 선형 자료구조

선형 자료구조

 선형 자료구조란 요소가 일렬로
나열되어 있는 자료구조를 말한다.

 

연결 리스트(Linked List)

 연결리스트는 데이터를 감싼 노드를
포인터로 연결해서

 공간적인 효율성을 극대화시킨 자료구조이다.

 삽입과 삭제가 O(1)이 걸리며 탐색에는
O(n)이 걸린다.

 위의 그림처럼 prev 포인터와 next 포인터로
앞과 뒤의 노드를 연결 시킨 것을

 연결 리스트라고 한다.

 연결 리스트는 싱글 연결 리스트, 이중 연결
리스트, 원형 이중 연결 리스트가 있다.

 참고로 맨 앞에 있는 노드를 해드(Head)라고 한다.

  • 싱글 연결 리스트: next 포인터만 가진다.
  • 이중 연결 리스트: next 포인터와 prev 포인터를 가진다.
  • 원형 이중 연결 리스트: 이중 연결리스트와 같지만 마지막 노드의 next 포인터가 헤드 노드를 가리키는 것을 말한다.

 해당 포스트에서는 이중 연결 리스트를
기반으로 설명하겠다.

 이중 연결 리스트는 앞에서부터 요소를 넣는
push_front(),

 뒤에서부터 요소를 넣는 push_back(), 중간에
요소를 넣는 insert() 등의 함수가 있다.

 

배열(Array)

 배열은 같은 타입의 변수들로 이루어져 있고,
크기가 정해져 있으며,

 인접한 메모리 위치에 있는 데이터를 모아놓은
집합이다.

 또한 중복을 허용하고 순서가 있다.

 여기서 설명하는 배열은 '정적 배열'을 기반으로
설명한다.

 탐색에 O(1)이 되어 랜덤 접근(Random Access)이
가능하다.

 삽입과 삭제에는 O(n)이 걸린다.

 따라서 데이터의 추가와 삭제를 많이 하는 것은
연결 리스트,

 탐색을 많이 하는 것은 배열로 하는 것이 좋다.

 배열은 인덱스에 해당하는 원소를 빠르게
접근해야 하거나

 간단하게 데이터를 쌓고 싶을 때 사용한다.

랜덤 접근과 순차적 접근

 직접 접근이라고 하는 랜덤 접근은 동일한 시간에
배열과 같은 순차적인 데이터가 있을 때

 임의의 인덱스에 해당하는 데이터에 접근할
수 있는 기능이다.

 이는 데이터를 저장된 순서대로 검색해야 하는
순차적 접근과는 반대이다.

배열과 연결 리스트 비교

 배열은 요소를 순서대로 나열한 데이터
구조이며 몇 번째 요소인지만 알면

 해당 요소의 데이터에 접근할 수 있다.

 연결 리스트는 요소를 선으로 연결한
형태의 데이터 구조이며,

 요소 안의 데이터를 알기 위해서는
하나씩 요소 내부를 확인해야 한다.

 위 그림에서 유추할 수 있듯이 탐색은
배열이 빠르고 연결 리스트는 느리다.

 배열의 경우 그저 요소 위에 있는 데이터를
탐색하면 되는 반면에,

 연결 리스트는 요소에 접근하여 데이터를
확인해야 하며

 주어진 선을 기반으로 순차적으로 접근해야
한다.

 하지만 데이터 추가 및 삭제는 연결 리스트가
더 빠르고 배열은 느리다.

 배열은 모든 요소를 앞으로 옮겨야 추가가
가능하지만,

 연결 리스트는 선을 바꿔서 연결해주기만
하면 되기 때문이다.

 

벡터(Vector)

 벡터는 동적으로 요소를 할당할 수 있는
동적 배열이다.

C# - List<T>, ArrayList
C#에서는 List라는 자료구조를 지원하며 이는 C++의 벡터(Vector)와 유사한 기능을 수행한다.

 컴파일 시점에 개수를 모른다면 벡터를
사용해야 한다.

 또한, 중복을 허용하고 순서가 있으며
랜덤 접근이 가능하다.

 탐색과 맨 뒤의 요소를 삭제하거나
삽입하는데 O(1)이 걸리며,

 맨 뒤나 앞이 아닌 요소를 삭제하고
삽입하는데 O(n)의 시간이 걸린다.

 참고로 뒤에서 부터 삽입하는 push_back()의
경우 O(1)의 시간이 걸리는데,

 벡터의 크기가 증가되는 시간 복잡도가
amortized 복잡도,

 즉 상수 시간 복잡도 O(1)과 유사한
시간 보갑도를 가지기 때문이다.

 위의 그림처럼 push_back()을 한다고 해서
매번 크기가 증가하는 것이 아니라

 2의 제곱 + 1마다 크기를 2배로 늘리는 것을
알 수 있다.

 ci를 i번째 push_back()을 할 때 드는 비용(Cost)
이라고 한다면

 ci는 1 또는 i + 2k라는 것을 알 수 있다.

 그렇다면 n번 push_back()을 한다고 했을 때
드는 비용 T(n)은 다음과 같은 식이다.

 이를 n으로 나누게 되면 push_back()을 할 때
평균적으로 드는 비용을 알 수 있는데,

 이것이 바로 3이기 때문에 1이라는 상수 시간에
가까운

 amortized 복잡도를 가진다는 것을 알 수 있다.

 그렇기 때문에 push_back()은 O(1)의
시간 복잡도를 가진다고 할 수 있다.

 

스택(Stack)

 스택은 가장 마지막으로 들어간 데이터가
가장 첫 번째로 나오는 성질을 가진 자료구조다.

 이를 LIFO(Last In First Out)라고 한다.

 재귀적인 함수, 알고리즘에 사용되며
웹 브라우저 방문 기록 등에 사용된다.

 삽입 및 삭제에 O(1), 탐색에 O(n)이 걸린다.

 

큐(Queue)

 큐는 먼저 집어넣은 데이터가 먼저 나오는 성질을
지닌 자료구조이며,

 나중에 집어넣은 데이터가 먼저 나오는 스택과는
반대되느 개념을 가졌다.

 이를 FIFO(First In First Out)이라고 한다.

 삽입 및 삭제에 O(1), 탐색에 O(n)이 걸린다.

 CPU 작업을 기다리는 프로세스, 쓰레드 행렬
또는 네트워크 접속을 기다리를 행렬,

 너비 우선 탐색, 캐시 등에 사용된다.


<면접을 위한 CS 전공지식 노트>