1. LouisLiu 2018-03-30

    一定绕不开状态机?

    • Lefland 2018-04-01

      @LouisLiu:虽然神经网络本身和状态机没有什么关系,但是状态机能够可视化的操作,对于程序苦手更友好一点。当然对于程序大神来说,直接去写一段神经网络的代码可能会更直接,更方便一点吧

  2. art9 2018-04-17

    a是变量,当B成功攻击到玩家时a++,相当于是一个正反馈。那没有攻击成功时要a--吗?

    其实我觉得这个模型有点像 Multi-armed Bandit(多臂老虎机):每轮选取一个arm,并且只能看到选了这个arm的reward,即打中或未打中。这里的arm就相当于B和C的行为动作。

    • Lefland 大前天 04-18 13:20

      @art9:攻击失败a--的话可能会导致不必要的麻烦,比如这个技能减为零就不会触发,其他分支的增加会增大基数,也就是变相的减少B技能的概率。而且概率永远不为零。看了一下多臂老虎机问题,确实可以近似看作多臂老虎机。但是是在玩家的水平不会改变的静态基础上。玩家的水平是不断变化的,越来越强,一些低级的策略在多次学习后就很容易被躲掉,而且玩家的数量是庞大的,每个玩家还是在变化的,所以传统的多臂老虎机的较优算法就不再适用。

  3. sgnieb 前天 04-19 07:57

    楼主对机器学习和游戏AI感兴趣的话,不妨去看下与增强学习有关的内容。

    • Lefland 前天 04-19 19:55

      @sgnieb:粗略的看了一下,我和增强学习的思想还是挺像的。打算跨考计算机的研究生,将来肯定还是要学到的吧。(我本来只想安安静静的当个策划不知道什么时候被拐到程序上来的啊啊啊。。。)

您需要登录或者注册后才能发表评论

登录/注册