九章算法笔记D7-双序列型动态规划

@[toc]

D7 双序列型动态规划

最长公共子串Leetcode1143

问题描述

给定两个字符串 text1 和 text2,返回这两个字符串的最长公共子序列的长度。

一个字符串的 子序列 是指这样一个新的字符串:它是由原字符串在不改变字符的相对顺序的情况下删除某些字符(也可以不删除任何字符)后组成的新字符串。
例如,”ace” 是 “abcde” 的子序列,但 “aec” 不是 “abcde” 的子序列。两个字符串的「公共子序列」是这两个字符串所共同拥有的子序列。

若这两个字符串没有公共子序列,则返回 0。

样例

1
2
3
4
5
6
输入:text1 = "abcde", text2 = "ace" 
输出:3
解释:最长公共子序列是 "ace",它的长度为 3。
输入:text1 = "abc", text2 = "abc"
输出:3
解释:最长公共子序列是 "abc",它的长度为 3。

分析

  1. 定义数组元素的含义: dp[i][j]表示 text1到下标i处,text2到下标j处的最长公共子序列的长度
  2. 确定数组元素之间的关系表达式
    • 如果 text1的i处与text2的j处的字符相等 则 dp[i][j]=dp[i-1][j-1]+1;
    • 否则 dp[i][j]=Math.max(dp[i-1][j],dp[i][j-1])
  3. 确定初始值 将数组初始化为0
  4. 根据关系表达式和初始值计算数组元素值
  5. 返回结果
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
public int longestCommonSubsequence(String text1, String text2) {
if(text1==null||text2==null||text1.length()<=0||text2.length()<=0){
return 0;
}
int m=text1.length();
int n=text2.length();
int dp[][]=new int[m+1][n+1];
for (int i = 1; i <= m; ++i) {
for (int j = 1; j <= n; ++j) {
if (text1.charAt(i-1) == text2.charAt(j-1)) {
dp[i][j] = dp[i-1][j-1] + 1;
} else {
dp[i][j] = Math.max(dp[i-1][j], dp[i][j-1]);
}
}
}
return dp[m][n];
}

交错字符串

问题描述

给定三个字符串 s1, s2, s3, 验证 s3 是否是由 s1 和 s2 交错组成的。

样例

1
2
3
4
输入: s1 = "aabcc", s2 = "dbbca", s3 = "aadbbcbcac"
输出: true
输入: s1 = "aabcc", s2 = "dbbca", s3 = "aadbbbaccc"
输出: false

分析

转移方程f[i][j] = (f[i-1][j] AND X[i+j-1] == A[i-1]) OR (f[i][j-1] AND X[i+j-1] ==B[j-1])

  1. f[i][j]:X前i+j个字符是否由A前i个字符和B前j个字符交错形成
  2. f[i-1][j] AND X[i+j-1] == A[i-1]:情况一,X前i+j-1个字符由A前i-1个字符和B前j个字符交错形成,X第i+j个字符等于A第i个字符
  3. f[i][j-1] AND X[i+j-1] ==B[j-1]:情况二,X前i+j-1个字符由A前i个字符和B前j-1个字符交错形成,X第i+j个字符等于B第j个字符

初始条件:空串由A的空串和B的空串交错形成 -> f[0][0] = true

边界情况:如果 i = 0,不考虑情况一;如果 j = 0,不考虑情况二

计算顺序:

1
2
3
4
5
6
f[0][0], f[0][1], ... ,f[0][n]
f[1][0], f[1][1], ... ,f[1][n]
...
f[m][0], f[m][1], ... ,f[m][n]
答案是f[m][n]
时间复杂度O(MN),空间复杂度O(MN),可用滚动数组优化空间至O(N)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
public boolean isInterleave(String ss1, String ss2, String ss3) {
char[] s1 = ss1.toCharArray();
char[] s2 = ss2.toCharArray();
char[] s3 = ss3.toCharArray();
int i, j;
int m = s1.length;
int n = s2.length;
if (m + n != s3.length)
return false;
boolean[][] f = new boolean[m + 1][n + 1];
for (i = 0; i <= m; i++) {
for (j = 0; j <= n; j++) {
if (i == 0 && j == 0) {
f[i][j] = true;
continue;
}
f[i][j] = false;
if (i > 0 && s3[i + j - 1] == s1[i - 1]) {
f[i][j] |= f[i - 1][j];
}
if (j > 0 && s3[i + j - 1] == s2[j - 1]) {
f[j][j] |= f[i][j - 1];
}
}
}
return f[m][n];
}

编辑距离

Problem

给定两个单词 word1 和 word2,计算出将 word1 转换成 word2 所使用的最少操作数 。

你可以对一个单词进行如下三种操作:

  • 插入一个字符
  • 删除一个字符
  • 替换一个字符

Example:

1
2
3
4
5
6
输入: word1 = "horse", word2 = "ros"
输出: 3
解释:
horse -> rorse (将 'h' 替换为 'r')
rorse -> rose (删除 'r')
rose -> ros (删除 'e')

思路:

  1. 还是老样子,按照上面三个步骤来,并且我这里可以告诉你,90% 的字符串问题都可以用动态规划解决,并且90%是采用二维数组。
  2. 大部分情况下,dp[i][j]dp[i-1][j]dp[i][j-1]dp[i-1][j-1] 肯定存在某种关系。
  3. 定义dp[i][j]的含义为:当字符串 word1 的长度为 i,字符串 word2 的长度为 j 时,将 word1 转化为 word2 所使用的最少操作次数为 dp[i][j]

由于我们是要让操作的次数最小,所以我们要寻找最佳操作。那么有如下关系式:

  1. 如果我们 word1[i] 与 word2 [j] 相等,这个时候不需要进行任何操作,显然有 dp[i][j] = dp[i-1][j-1]。(别忘了dp[i][j]的含义哈)。
  2. 如果我们 word1[i] 与 word2 [j] 不相等,这个时候我们就必须进行调整,而调整的操作有 3 种,我们要选择一种。三种操作对应的关系试如下(注意字符串与字符的区别):
    1. 如果把字符 word1[i] 替换成与 word2[j] 相等,则有dp[i][j] = dp[i-1][j-1] + 1;
    2. 如果在字符串 word1末尾插入一个与 word2[j] 相等的字符,则有 dp[i][j] = dp[i][j-1] + 1;
    3. 如果把字符 word1[i] 删除,则有 dp[i][j] = dp[i-1][j] + 1;
  3. 那么我们应该选择一种操作,使得 dp[i][j] 的值最小,显然有

dp[i][j] = min(dp[i-1][j-1],dp[i][j-1],dp[[i-1][j]]) + 1;

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
public int minDistance(String word1, String word2) {
int n1 = word1.length();
int n2 = word2.length();
int[][] dp = new int[n1 + 1][n2 + 1];
// dp[0][0...n2]的初始值
for (int j = 1; j <= n2; j++)
dp[0][j] = dp[0][j - 1] + 1;
// dp[0...n1][0] 的初始值
for (int i = 1; i <= n1; i++)
dp[i][0] = dp[i - 1][0] + 1;
// 通过公式推出 dp[n1][n2]
for (int i = 1; i <= n1; i++) {
for (int j = 1; j <= n2; j++) {
// 如果 word1[i] 与 word2[j] 相等。第 i 个字符对应下标是 i-1
if (word1.charAt(i - 1) == word2.charAt(j - 1)) {
dp[i][j] = dp[i - 1][j - 1];
} else {
dp[i][j] = Math.min(Math.min(dp[i - 1][j - 1], dp[i][j - 1]), dp[i - 1][j]) + 1;
}
}
}
return dp[n1][n2];
}

2020年7月9日更