お題箱より。
問題概要
文字列 が与えられ、それぞれの長さは
である。また整数
が与えられる。
以下の条件を満たすような 個の文字列の組
の、長さの総和の最大値を求めよ。
のどの文字列も空でない。
のどちらにも、
がこの順番に重なることなく連続部分文字列として出現する。
制約
は英小文字からなる
- 問題の条件を満たす
が存在することが保証されている
※添字に を使いたいので入力の
を大文字にしました。
解法
※文字列のインデックスは先頭を0文字目とする0-indexedで扱います。
この問題は最長共通部分列(LCS)の応用です。LCSとは2つの文字列 に対して、「
のどちらの(連続とは限らない)部分列にもなっているような文字列のうち、最長のもの(の長さ)」を求めたものです。
これはそれぞれの文字列の長さを として
のDPで求めることができます。具体的には、
文字列
の
文字目までと文字列
の
文字目までを見終わったときの、そこまでの共通部分列の長さの最大値
と定義して、以下の3パターンの遷移を考えます。
の
文字目を採用せずに無視する
の
文字目を採用せずに無視する
の
文字目と
の
文字目が等しい場合、これを共通部分列に採用する
今回の問題の条件は部分列に求められる条件が少し厳しくなっていて、 個の連続部分文字列として抜き出す必要があります。
の値が小さいことに注目して、DPの添字として「これまで連続部分列を何個使ったか」の添字
を加えましょう。この
は新しい連続部分列を始める時に1増やすことにします(終わるときでも良いです)。
DPの中での の増え方は以下のように考えられます。
- 文字を1つも採用していない時、あるいはいったん「採用せずに無視する」遷移によって途切れた後に新しい連続部分列を始めると、必ず
が1増える。
- 文字を採用した直後の遷移でまた文字を採用する場合は、前の連続部分列にくっつける(
が増えない)か、新しい連続部分列を始める(
が1増える)かを選ぶことができる。
これらを区別するためには、「最後に見たところの文字を採用したか」のフラグがあれば良いです。
つまり、最終的にDPの状態は以下のように定義すると上手くいきます。
:文字列
の
文字目までと
の
文字目までを見て、これまでに連続部分列を
個使っていて、最後に見たところの文字を採用した
/採用していない
時の、長さ合計の最大値
遷移も通常のLCSのDPを以下のように応用すれば良いです。
- 遷移後の
の値を、文字を採用せずに無視する遷移では
、文字を採用する遷移では
とする。
の状態から
の状態に遷移する時には
を1増やす。
の状態から
の状態に遷移する時には、
を1増やす場合と増やさない場合の2つの遷移を行う。
最終的には と
のうち大きいほうが答えになります。