본문 바로가기
알고리즘/백준

[백준 1701] Cubeditor (C++)

by fortissimo 2024. 6. 5.

https://www.acmicpc.net/problem/1701

 

문제


Cubelover는 프로그래밍 언어 Whitespace의 코딩을 도와주는 언어인 Cubelang을 만들었다. Cubelang을 이용해 코딩을 하다보니, 점점 이 언어에 맞는 새로운 에디터가 필요하게 되었다. 오랜 시간 고생한 끝에 새로운 에디터를 만들게 되었고, 그 에디터의 이름은 Cubeditor이다.

텍스트 에디터는 찾기 기능을 지원한다. 대부분의 에디터는 찾으려고 하는 문자열이 단 한 번만 나와도 찾는다. Cubelover는 이 기능은 Cubelang에 부적합하다고 생각했다. Cubelang에서 필요한 기능은 어떤 문자열 내에서 부분 문자열이 두 번 이상 나오는 문자열을 찾는 기능이다. 이때, 두 부분 문자열은 겹쳐도 된다.

예를 들어, abcdabc에서 abc는 두 번 나오기 때문에 검색이 가능하지만, abcd는 한 번 나오기 때문에 검색이 되지를 않는다.

이렇게 어떤 문자열에서 두 번 이상 나오는 부분 문자열은 매우 많을 수도 있다. 이러한 부분 문자열 중에서 가장 길이가 긴 것을 구하는 프로그램을 작성하시오.

예를 들어, abcabcabc에서 abc는 세 번 나오기 때문에 검색할 수 있다. 또, abcabc도 두 번 나오기 때문에 검색할 수 있다. 하지만, abcabca는 한 번 나오기 때문에 검색할 수 없다. 따라서, 두 번 이상 나오는 부분 문자열 중에서 가장 긴 것은 abcabc이기 때문에, 이 문자열이 답이 된다.

 

입력


첫째 줄에 문자열이 주어진다. 문자열의 길이는 최대 5,000이고, 문자열은 모두 소문자로만 이루어져 있다.

 

출력


입력에서 주어진 문자열의 두 번이상 나오는 부분문자열 중에서 가장 긴 길이를 출력한다.

 

문제 풀이


KMP 알고리즘의 파이배열만 구하면 되는 문제.

앞부분부터 만들어지는 문자열인 접두사와 뒷부분부터 만들어지는 문자열인 접미사를 확인하여 접두사와 접미사의 길이가 가장 길 때(=경계)를 파이 배열에 저장한다.

 

아래는 코드.

#include <iostream>
using namespace std;
int* pi = new int[5001];

int getPiAndMaxLength(string patternStr)
{
	int j = 0;
	int length = 0;
	for (int i = 1; i < patternStr.length(); i++)
	{
		while (j > 0 && patternStr.at(i) != patternStr.at(j))
		{
			j = pi[j - 1];
		}
		if (patternStr.at(i) == patternStr.at(j))
		{
			j++;
			pi[i] = j;
		}
		length = max(length, pi[i]);
	}
	return length;
}

void resetPi()
{
	for (int i = 0; i < 5001; i++)
	{
		pi[i] = 0;
	}
}

int main()
{
	cin.tie(NULL);
	ios::sync_with_stdio(false);

	string str;
	int answer = 0;
	cin >> str;
	for (int i = 0; i < str.length(); i++)
	{
		resetPi();
		string subsString = str.substr(i, str.length());
		int currentMaxLength = getPiAndMaxLength(subsString);
		answer = max(answer, currentMaxLength);
	}
	cout << answer << "\n";
	return 0;
}

'알고리즘 > 백준' 카테고리의 다른 글

[백준 1414] 불우이웃돕기 (C++)  (0) 2024.06.07
[백준 1254] 팰린드롬 만들기 (C++)  (0) 2024.06.06
[백준 2436] 공약수 (C++)  (0) 2024.06.03
[백준 2473] 세 용액 (C++)  (0) 2024.06.02
[백준 1495] 기타리스트 (C++)  (0) 2024.06.01