大数据算法

欢迎光临 x-algo
关注算法在工业界应用
Hi, 这是一个关注大数据算法在工业界应用的网站

最新发布

Deep Learning

BERT衍生文本模型(2019)

leihao阅读(41)评论(0)

ALBERT(2019) 目标是探索出来一个轻量级的bert 随着参数的增加,在没有明显过拟合的情况下,原始的bert性能是会下降;所以增加参数不是万能的 通过并行化和优化内存管理加速bert,都只是从工程上对bert进行优化,并未真正解决...

NLP

一篇关键词相关的综述

leihao阅读(127)评论(0)

Automatic Keyphrase Extraction: A Survey of the State of the Art 为什么要进行关键词提取? 信息检索使用 摘要提取 文本分类 观点挖掘 文档索引(document indexi...

Deep Learning

视频行为理解

leihao阅读(253)评论(0)

行为识别是用来识别“人自身”、“人和人”、“人和物”的“行为”。比如“抽烟”,“打架”。这个任务有好几个数据集,接下来先介绍一下各个数据集。 数据集 HMDB-51(2011) 其中包含51 action,7k clips; 这个数据集合包...

Deep Learning

DNPG:Decomposable Neural Paraphrase Generation

leihao阅读(274)评论(0)

复述生成进行建模,强调word、phrase级别可以代表领域信息,sentence级别代表“全局”信息,其实就是对“意图”和“实体”进行显式建模。下面是一个例子: 模型流程 通过不同的encoder和decoder对不同粒度进行生成 更好的...

Deep Learning

Wide&Deep/DeepFM/NIM/NIEM

leihao阅读(2145)评论(0)

本文记录几个在广告和推荐里面rank阶段常用的模型 Wide&Deep 在推荐的场景中,最重要的行为数据是点击(下载/购买)数据,传统的Wide类型的特征可以对确定性的推荐很好的建模, 如果考虑到多样性,就需要对稀疏数据和"没有直接...

Machine comprehension

机器阅读理解

leihao阅读(2369)评论(0)

终于还是入坑了,时间有限,能刷几篇是几篇... 机器阅读理解任务的语料一般是一个三元组: \(\{(P_n,Q_n,a_n)\}_n^N\) 其中,P为段落,Q为问题,a为答案.连起来就是:在给定问题Q,在可能存在答案的段落P中找到答案a,...

CNN

DSSM/CDSSM

leihao阅读(5226)评论(0)

两个老文章,对搜索文本分模型影响很大. DSSM 其中 \(W_1\) 是hash策略,不是要学的参数,特别的地方就是hash策略.文章通过hash进行降维,本质上还是bag of words模型.最大化有点击的样本的概率. CDSSM 想...

关注大数据算法在工业界应用

本站的GitHub关于本站