欢迎光临 x-algo
关注算法在工业界应用
Hi, 这是一个关注大数据算法在工业界应用的网站

2017年04月的文章

强化学习

强化学习(4)-动态规划

leihao阅读(2001)评论(0)

动态规划、蒙特卡洛、时序差分是三种解决有限马尔科夫决策的有效方法,方法各有优缺点,本文先介绍「动态规划」。 在数学上,动态规划方法比较优美,但是需要对环境建立一个完整且准确的模型;蒙特卡洛方法不需要一个模型,并且非常简单,但是不善于渐进计算...

强化学习

强化学习(2)-Bandit问题

leihao阅读(3109)评论(0)

熟悉EE的对这个问题应该不陌生,可以看文章:推荐系统的EE问题及Bandit算法得到更多信息。 文中evaluative feedback和instructive feedback愣是没看懂啥意思 n-Armed Bandit Proble...

强化学习

强化学习(1)-介绍

leihao阅读(2335)评论(0)

本文读书笔记《Reinforcement Learning: An Introduction》 对人类来说,学习离不开和环境的交互。对原始的人类,在没有老师传授知识的时候,人类通过和环境的「交互」学习;经过多轮和环境交互,最终总结出规律,知...

LSTM

Grammar as a Foreign Language

leihao阅读(2557)评论(0)

原始论文:《Grammar as a Foreign Language》 如论文的标题,论文特别的地方是将「句法分析」这件事变为一个「翻译」问题。 不了解RNN和LSTM的可以先看RNN(Recurrent Neural Networks)...

LSTM

Manhattan LSTM Model

leihao阅读(2199)评论(0)

文章《Siamese Recurrent Architectures for Learning Sentence Similarity》提出来一个计算句子相似度的方法;求两个句子的相似度在很多地方需要用到,例如文章的聚类,相似文章的推荐等。...

关注大数据算法在工业界应用

本站的GitHub关于本站