欢迎光临 x-algo
关注算法在工业界应用
Hi, 这是一个关注大数据算法在工业界应用的网站

Adversarial Learning of Task-Oriented Neural Dialog Models

通过这个论文发现还有User的simulator,将来关注一下

论文:Adversarial Learning of Task-Oriented Neural Dialog Models

reward获取

  • 设计reward是关键问题,对于对话满意度的评估,对话轮数/时间是很重要的特征
  • 协同过滤的方法
  • 卷积神经网络的方法预测
  • 给予高斯过程的在线学习
  • inverse reinforcement learning,需要高额的样本数据,

Generator

结构如下图:

WX20180707-221609@2x

 

User input可以是原始的word级别的词,也可以是nlu的输出; \(E_k\) 表示的是通过数据库获取的信息的状态; \(V_k\) 可以认为是DST的输出.Policy Network是一个三层的MLP.

Discriminator

设计了四种类型的特征,我个人很怀疑这个D的效果...

WX20180707-230608@2x

算法流程:

WX20180707-231042@2x

 

 

 

 

 

未经允许不得转载:大数据算法 » Adversarial Learning of Task-Oriented Neural Dialog Models

评论 抢沙发

*

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

关注大数据算法在工业界应用

本站的GitHub关于本站