zaoan660
zaoan660
感谢博主的教程,我收获很多,只是我还有两个问题: policy iteration 每进行一次 sweep 就使用贪心算法更新一次 policy 就是 value iteration 吗,因为算出来的结果是一样的 一次 policy evaluation 是指更新到价值收敛还是一次 sweep 呀 sweep 词语是我在博主推荐可视化网站看到的就是 'Policy Evaluation (one sweep) '按钮 https://cs.stanford.edu/people/karpathy/reinforcejs/gridworld_dp.html
> 倒腾了半天下载好了,gradle版本8.0。 虽然一年多了但还是回复一下,在settings.gradle(项目名)这里加上一行: > > ``` > dependencyResolutionManagement { > repositoriesMode.set(RepositoriesMode.FAIL_ON_PROJECT_REPOS) > repositories { > google() > mavenCentral() > jcenter() // 关键是这个仓库!!! > } > } > ``` 谢谢你,也许你的回复对楼主有点晚,但对我有很大的帮助
我降级到0.20.3后打不开学习通,但是其他应用有的可以打开.我记得以前能打开,学习通更新到现在的6.3.0就打不开了
雷电模拟器9可以打开,只是打开后不能添加软件,应该是模拟器的问题,我的旧手机可以用
11-[JavaScript模块化:CMD.md]也是异步加载,感觉可能是打错字了,我记得你前面写的是异步这一章写的同步
signcode是老师发布签到时设置的签到码
我咋看手势签到需要signCode,就是发签到时用到的码,你写出来了不