개발(코딩)/백준 문제풀이

[Python] 백준 14425번 문자열 집합(실버4)

아는 개 산책 2025. 3. 29. 00:37

문제

총 N개의 문자열로 이루어진 집합 S가 주어진다.

입력으로 주어지는 M개의 문자열 중에서 집합 S에 포함되어 있는 것이 총 몇 개인지 구하는 프로그램을 작성하시오.

입력

첫째 줄에 문자열의 개수 N과 M (1 ≤ N ≤ 10,000, 1 ≤ M ≤ 10,000)이 주어진다.

다음 N개의 줄에는 집합 S에 포함되어 있는 문자열들이 주어진다.

다음 M개의 줄에는 검사해야 하는 문자열들이 주어진다.

입력으로 주어지는 문자열은 알파벳 소문자로만 이루어져 있으며, 길이는 500을 넘지 않는다. 집합 S에 같은 문자열이 여러 번 주어지는 경우는 없다.

출력

첫째 줄에 M개의 문자열 중에 총 몇 개가 집합 S에 포함되어 있는지 출력한다.

예제 입력 1

5 11
baekjoononlinejudge
startlink
codeplus
sundaycoding
codingsh
baekjoon
codeplus
codeminus
startlink
starlink
sundaycoding
codingsh
codinghs
sondaycoding
startrink
icerink

예제 출력 1

4

풀이

숫자를 Set에 저장하고, 주어진 숫자의 포함 여부를 출력해봅시다.

더보기

Point

  • Set(집합)
  • _ in _

 


소스코드

import sys
def input():
    return sys.stdin.readline().strip()

n,m = map(int,input().split())
S = set()
check = []
cnt = 0
for _ in range(n):
    S.add(input())
for _ in range(m):
    cnt += int(input() in S)

print(cnt)

 

집합 S를 만들고 원소들을 집어넣어 줍니다.

이후, 집합 안에 해당되는 원소가 있으면, 그 갯수를 세어줍니다.

Line 1~3

import sys
def input():
    return sys.stdin.readline().strip()

 

많은 문자열을 짧은 시간내로 받기 위해 input()함수를 sys.stdin.readline().strip()으로 대체합니다.

Line 5~14

n,m = map(int,input().split())
S = set()
check = []
cnt = 0
for _ in range(n):
    S.add(input())
for _ in range(m):
    cnt += int(input() in S)

print(cnt)

 

S라는 set을 만들어 input 값을 받아줍니다.

문제에서 제시된 n과 m을 받아서 이후 입력될 n개의 문자열을 집합에 추가시키고, m개의 문자열을 check 해 줍시다.

 

python의 자료형에서 어떤 원소가 있는지, 없는지 가장 빠르게 판단하게 해 주는 자료형은 Set(집합)입니다.

Set에 원소를 추가할 때, 원소의 고유한 hash를 계산해서 저장하게 됩니다.

이 hash를 기반으로 원소의 포함 여부를 탐색하는 데에 걸리는 평균 시간복잡도는 O(1)으로,

같은 길이 n을 갖는 list에서의 탐색 시간복잡도인 O(n)보다 월등히 빠릅니다.

이는 원소가 많아질수록 유리하게 작용됩니다.

 

cnt에 우리가 구하고자 하는 '집합 S에 포함되어있는 문자열의 갯수'를 넣어주게 될 것입니다. 0으로 초기화해 줍시다.

 

m개의 문자열을 받으며 집합 S에 있으면 1을, 없으면 0을 cnt에 더해줍니다.