Skip to content

Latest commit

 

History

History
71 lines (57 loc) · 2.32 KB

10_正则表达式匹配.md

File metadata and controls

71 lines (57 loc) · 2.32 KB

10.正则表达式匹配

问题

给定一个字符串(s) 和一个字符模式(p)。实现支持*.的正则表达式匹配。 '.' 匹配任意单个字符。 '*' 匹配零个或多个前面的元素。

匹配应该覆盖整个字符串(s) ,而不是部分字符串。 说明:

  • s可能为空,且只包含从a-z的小写字母。
  • p可能为空,且只包含从a-z的小写字母,以及字符.*
示例 1:

输入:
s = "aa"
p = "a"
输出: false
解释: "a" 无法匹配 "aa" 整个字符串。
示例 2:

输入:
s = "aa"
p = "a*"
输出: true
解释: '*' 代表可匹配零个或多个前面的元素, 即可以匹配 'a' 。因此, 重复 'a' 一次, 字符串可变为 "aa"。
示例 3:

输入:
s = "ab"
p = ".*"
输出: true
解释: ".*" 表示可匹配零个或多个('*')任意字符('.')。
示例 4:

输入:
s = "aab"
p = "c*a*b"
输出: true
解释: 'c' 可以不被重复, 'a' 可以被重复一次。因此可以匹配字符串 "aab"。
示例 5:

输入:
s = "mississippi"
p = "mis*is*p*."
输出: false

解答

刚开始用之前写正则引擎的思路,尝试构造出一个DFA,用表格来记录。但是这样很麻烦,而且这道题只需要实现*.就行了。所以,可以用DP的思路来写。

用一个dp二维数组来存储子问题的解,其中dp[i-1][j-1]表示s[:i+1]p[:j+1]这个子问题的解。之所以多留出一行一列,是为了方便处理空字符串的问题,因为'a*'就可以匹配''

然后,我们遍历s。每次,多添加进来一个字符后,就遍历一次p,来更新子问题的解。可以分为两种情况,如果出现了*,那么就可以选择匹配或者不匹配。如果不是*,那就很简单了,判断是否字符相等或者p[j-1].就行。

class Solution:
    def isMatch(self, s, p):
        dp = [[False for _ in range(len(p)+1)] for __ in range(len(s)+1)]
        dp[0][0] = True
        for i in range(0, len(s)+1):
            for j in range(1, len(p)+1):
                if p[j-1] == '*':
                    dp[i][j] = dp[i][j-2] or (i > 0 and j > 1 and dp[i-1][j] and (p[j-2] == '.' or s[i-1] == p[j-2]))
                else:
                    dp[i][j] = i > 0 and (p[j-1] == '.' or p[j-1] == s[i-1]) and dp[i-1][j-1]
        return dp[-1][-1]