授课老师:彭振辉
参考 CS188 UCBerkeley Fall2018 课程内容
理论习题 Gradescope
学校选择UC berkely,课程注册码为:93PWD8
所有课程课件存储在课件文件夹中
MiniMax
MDP-markov-decision-process
-
Markov decision process MDP 基础概念介绍和代码示例
-
关于 project3 task4 中 Prioritized Sweeping Value Iteration 算法的介绍
RL-强化学习
- note10 - Exploration and Exploitation
- note11 - Reinforcement Learning
- model-based ADP learner with code implementation
- Model-free MC learner with code implementation -- Monte Carlo 蒙特卡洛
- Reinforcement learning: concepts of Q-learning
- Reinforcement learning: Q-learner with detailed example and code implementation
Machine Learning
Bayes Net and HMM
- HMM
- VE-1: vairable elimination -- 斯坦福大学 cs288note,思路与课件一致,归纳总结的很棒,但更多的是直觉上的阐述
- VE-2: vairable elimination -- 给出了代码示例和详尽的例子
- 判断贝叶斯网络中变量是否独立
- 机器学习-白板推导系列-隐马尔可夫模型
https://adaptable-agenda-988.notion.site/9846c667938a41ca9126b4030d58027b?pvs=74