【算法】DP问题——状态机模型

DLShark / 2025-02-21 / 原文

基本内容

入门例子 Leetcode 3259. 超级饮料的最大强化能量

题目简述：有两个数组energyDrinkA和energyDrinkB，分别代表两种能量饮料每小时提供的能量，在接下来的n小时内选择饮用这两种饮料中的一种，以最大化总能量。但是，如果你从一个饮料切换到另一个，你需要等待一个小时才能开始获得能量。

输入：energyDrinkA = [4, 1, 1], energyDrinkB = [3, 1, 1]

输出：7

基本思想

将可能存在的 K 个状态在原来 dp 数组扩展为二维数组 DP[N] → DP[N][K]，以入门例子为例，第一个状态是第 i 个小时喝的饮料为 A ，第二个状态是第 i 个小时喝的饮料为 B，每一个状态都可能来自于不同的状态，切换状态的第 i 个小时不摄入能量。

假设第 i 时刻的状态为 B ，则可能有两种状态切换：

① A → B：第 i 时刻无法摄入能量

② B → B：摄入 B

解题代码

def maxEnergy(energyDrinkA, energyDrinkB):
    N = len(energyDrinkA)
    dp = [[0] * 2 for _ in range(N)] # 存储第i时刻喝A或者B饮料两种状态的最大值
    dp[0][0] = energyDrinkA[0]
    dp[0][1] = energyDrinkB[0]
    
    for i in range(1, n):
        # 第i时刻饮用 A
        dp[i][0] = max(dp[i - 1][0] + energyDrinkA[i],  # 继续喝 A
                       dp[i - 1][1])                  # 切换到 A，这一小时内不摄入内量
        
        # 第i时刻饮用 B
        dp[i][1] = max(dp[i - 1][1] + energyDrinkB[i],  # 继续喝 B
                       dp[i - 1][0])                  # 切换到 B，上一小时喝 A
    return max(dp[n - 1][0], dp[n - 1][1])

总结

这种题目有 K 个状态就是建立 DP[N][K] 的二维DP数组，若题目有三种饮料就是DP[N][3]，在没理解到使用状态压缩DP时，我尝试用一维数组建立，遍历可能存在的不同状态：① 继续喝同样的饮料；② 切换饮料；③ 可能存在一种情况: energyDrinkA = [3, 5, 3], energyDrinkB = [3, 4, 5] , 这种情况下只使用 ①、②状态都无法满足最优解。

题目

Leetcode 198. 打家劫舍

该题第 i 家房屋的状态划分为偷与没偷，对应了入门例子的第 i 个时间的状态是喝 A 饮料还是 B 饮料

class Solution:
    def rob(self, nums: List[int]) -> int:
        # 第一个数组存储第i次没偷， 第二个数组存储第i次偷了
        dp = [[0 for _ in range(len(nums))] for _ in range(2)] 
        dp[1][0] = nums[0] 
        for i in range(1, len(nums)):
            dp[0][i] = max(dp[0][i-1], dp[1][i-1])
            dp[1][i] = dp[0][i-1] + nums[i] #第i家偷了，上一家指定没偷
        return max(max(dp[0]), max(dp[1]))

Leetcode 213. 打家劫舍 II

与上一题目相比，需要判断最后一家和第一家是否同时偷取，如果偷了第一家，最后一家则不能偷取，反之也然。原来的题目在第 i 个房屋对应着两个状态，根据两个状态是无法判断是否偷取第一家，因为每个状态都可以由第 i-1 时刻的不同状态切换。因此，可以额外加入两个状态对应着在第一家不偷取的前提下第 i 个房屋的两个状态。

\[\begin{cases} 第一家偷 \begin{cases} 第i家偷\\ 第i家不偷\\ \end{cases} \\ 第一家不偷 \begin{cases} 第i家偷\\ 第i家不偷\\ \end{cases} \\ \end{cases} \]

class Solution:
    def rob(self, nums: List[int]) -> int:
        if not nums:
            return 0
        if len(nums) == 1:
            return nums[0]
        n = len(nums)
        dp = [[0] * n for _ in range(4)]
        dp[1][0] = nums[0]
        for i in range(1, n):
            if i < n - 1: 
                dp[0][i] = max(dp[0][i-1], dp[1][i-1]) 
                dp[1][i] = dp[0][i-1] + nums[i]
                dp[2][i] = max(dp[2][i-1], dp[3][i-1])
                dp[3][i] = dp[2][i-1] + nums[i]
            else:  
                dp[0][i] = max(dp[0][i-1], dp[1][i-1])
                dp[1][i] = dp[0][i-1] # 最后一家不偷，不需要加上nums[i]
                dp[2][i] = max(dp[2][i-1], dp[3][i-1])
                dp[3][i] = dp[2][i-1] + nums[i]  

        return max(dp[0][n-1], dp[1][n-1], dp[2][n-1], dp[3][n-1])