집합(set)은 파이썬 2.3부터 지원하기 시작한 자료형으로, 집합에 관련된 것을 쉽게 처리하기 위해 만든 자료형이다.
>>> s1 = set([1,2,3]) # 리스트입력
>>> s1
{1,2,3}
>>> s2 = set("Hello")
>>> s2
{'e', 'H', 'l', 'o'}
[!] 비어 있는 집합 자료형은 s = set()로 만들 수 있다.
집합 자료형의 특징
set("Hello") 결과를 보면 이상하게 출력된 걸 확인할 수 있다.
생성된 자료형에는 l 문자가 하나 빠져있고 순서도 뒤죽박죽이다. 그 이유는 set에 2가지 특징이 있기 때문이다.
- 중복을 허용하지 않는다.
- 순서가 없다.(Unordered)
리스트나 튜플은 순서가 있기 때문에 인덱싱을 통해 자료형의 값을 얻을 수 있지만 set 자로형은 순서가 없기 때문에 인덱싱으로 값을 얻을 수 없다. 이는 딕셔너리와 비슷하다. 딕셔너리 역시 순서가 없는 자료형이라 인덱싱을 지원하지 않는다.
만약 set 자료형에 저장된 값을 인덱싱으로 접근하려면 다음과 같이 리스트나 튜플로 변환 후 해야한다.
>>> s1 = set([1,2,3])
>>> li = list(s1)
>>> li
[1,2,3]
>>> li[0]
1
>>> t1 = tuple(s1)
>>> t1
(1,2,3)
>>> t1[0]
1
교집합, 합집합, 차집합 구하기
set 자료형을 정말 유용하게 사용하는 경우는 교집합, 합집합, 차집합을 구할 때이다.
우선 다음과 같이 2개의 set 자료형을 만든 후 따라 해보자. s1은 1부터6까지의 값을
s2는 4부터 9까지의 값을 가진다.
>>> s1 = set([1,2,3,4,5,6])
>>> s2 = set([4,5,6,7,8,9])
1. 교집합(&, intersection() )
>>> s1 & s2
{4,5,6}
2. 합집합(|, Union() ) !!! 중복해서 포함된 값은 한개씩만 표현된다.
>>> s1 | s2
{1,2,3,4,5,6,7,8,9}
3. 차집합(-, difference() )
>>> s1 - s2
{1,2,3}
>>> s2 - s1
{8,9,7}
집합 자료형 관련 함수들
값 1개 추가하기(add)
이미 만들어진 set 자료형에 값을 추가할 수 있다. 1개의 값만 추가 할 경우에는 다음과 같이 한다.
>>> s1 = set([1,2,3])
>>> s1.add(4)
>>> s1
{1,2,3,4}
값 여러개 추가하기(update)
>>> s1 = set([1,2,3])
>>> s1.update([4,5,6])
>>> s1
{1,2,3,4,5,6}
특정 값 제거하기(remove)
>>> s1 = set([1,2,3])
>>> s1.remove(2)
>>> s1
{1,3}
정리
-집합은 순서가 없고 중복을 허용하지 않는다.
-중복을 허용하지 않는다는 특징을 이용해서 리스트나 튜플의 중복을 제거할 수 있다.
-순서가 없기 때문에 인덱싱을 이용한 데이터 참조를 하고 싶다면 리스트나 튜플로 변환 후 사용해야 한다.
'Language > Python' 카테고리의 다른 글
| 점프 투 파이썬 - 변수 (0) | 2019.07.08 |
|---|---|
| 점프 투 파이썬 - 불 자료형 (0) | 2019.07.08 |
| 점프 투 파이썬 - 딕셔너리 자료형★ (0) | 2019.07.08 |
| 점프 투 파이썬 - 튜플 자료형 (0) | 2019.07.08 |
| 점프 투 파이썬 - 리스트 자료형 (2) | 2019.07.06 |
댓글