Multi-agent-RL issues

Results 2 Multi-agent-RL issues

Sort by recently updated

TD-Linear中Reward list 坐标对应错误

![image](https://github.com/user-attachments/assets/8c4e5b3a-255d-4add-a771-c544c8fc35f1) TD-Linear中reward list初始化有问题，和GridEnv PSA矩阵的初始化过程中的reward list的顺序不一致： ![image](https://github.com/user-attachments/assets/aecb06b7-1c49-41ff-ba50-c25613e6844a) 这会导致TD-Linear中的```policy_evaluation```函数得不到正确的状态值

dalton-ly

MC_Basic.py中sum_qvalue_list.append(sum_qvalue)位置错误

RL_Learning-main/scripts/Chapter5_Monte Carlo Methods/MC_Basic.py ## 当前有问题的代码： ```python sum_qvalue_list = [] for each_episode in episodes: sum_qvalue = 0 for i in range(len(each_episode)): sum_qvalue += (self.gama**i) * each_episode[i]['reward'] sum_qvalue_list.append(sum_qvalue) # ❌ 错误位置：在循环外面 self.qvalue[state][action]...

konyyds

Multi-agent-RL
Multi-agent-RL copied to clipboard

Metadata

TD-Linear中Reward list 坐标对应错误

MC_Basic.py中sum_qvalue_list.append(sum_qvalue)位置错误

← Metadata

Owner

Metadata

Multi-agent-RL Multi-agent-RL copied to clipboard

Metadata

TD-Linear中Reward list 坐标对应错误

MC_Basic.py中sum_qvalue_list.append(sum_qvalue)位置错误

← Metadata

Owner

Metadata

Multi-agent-RL
Multi-agent-RL copied to clipboard