欢迎光临 x-algo
关注算法在工业界应用
Hi, 这是一个关注大数据算法在工业界应用的网站

NLP

一篇关键词相关的综述

leihao阅读(127)评论(0)

Automatic Keyphrase Extraction: A Survey of the State of the Art 为什么要进行关键词提取? 信息检索使用 摘要提取 文本分类 观点挖掘 文档索引(document indexi...

DNPG:Decomposable Neural Paraphrase Generation

leihao阅读(274)评论(0)

复述生成进行建模,强调word、phrase级别可以代表领域信息,sentence级别代表“全局”信息,其实就是对“意图”和“实体”进行显式建模。下面是一个例子: 模型流程 通过不同的encoder和decoder对不同粒度进行生成 更好的...

机器阅读理解

leihao阅读(2369)评论(0)

终于还是入坑了,时间有限,能刷几篇是几篇... 机器阅读理解任务的语料一般是一个三元组: \(\{(P_n,Q_n,a_n)\}_n^N\) 其中,P为段落,Q为问题,a为答案.连起来就是:在给定问题Q,在可能存在答案的段落P中找到答案a,...

DSSM/CDSSM

leihao阅读(5226)评论(0)

两个老文章,对搜索文本分模型影响很大. DSSM 其中 \(W_1\) 是hash策略,不是要学的参数,特别的地方就是hash策略.文章通过hash进行降维,本质上还是bag of words模型.最大化有点击的样本的概率. CDSSM 想...

A Two-stage Bootstrapping Algorithm for Relation Extraction

wencai阅读(1338)评论(0)

简介 论文主要介绍了一个特定关系提取的两级自扩展算法。在常规的一级自扩展算法之上添加一层pattern query查找nominal,可以解决关系subtype的局限性问题(即可提取更多subtype的关系,文章主要讲EMP-ORG关系的提...

Chinese Poetry Generation with Recurrent Neural Networks

leihao阅读(1511)评论(0)

最近研究一下文本生成,记录一下 整体结构 本文结构算是比较复杂的,结构如下图: 具体为: 选择关键词列表 根据关键词得到相似的phrase集合 根据phrase进行组合,得到很多候选诗句 从候选里面选择一个得分最高的,作为第一句 根据以前的...

Adversarial Learning for Neural Dialogue Generation

leihao阅读(1687)评论(0)

特点 论文想法类似于SeqGAN,有下面几点不同: 作用与对话生成,而不是单个序列 引入一个base model,评估状态价值 \(b(\{x,y\})\) , 这个模型是当前策略 \(\pi\) 下,D的输出作为reward通过强化学习得...

关注大数据算法在工业界应用

本站的GitHub关于本站