konyyds
Results
1
comments of
konyyds
修改sum_qvalue_list.append(sum_qvalue)位置后,发现得不到正确的结果了,原来是episodes 列表在循环外部定义,导致它不断累积所有state-action对的episode。 ### 有问题的地方 ``` episodes = [] # 这个应该在每个state-action对内部初始化 for epoch in range(epochs): for state in tqdm(range(self.state_space_size)): for action in range(self.action_space_size): # episodes 应该在这里初始化,而不是在循环外部 ``` ### 修改后的mc_basic_simple_GUI如下: ``` def...