欢迎光临 x-algo
关注算法在工业界应用
Hi, 这是一个关注大数据算法在工业界应用的网站

Deep Learning

DSSM/CDSSM

leihao阅读(1551)评论(0)

两个老文章,对搜索文本分模型影响很大. DSSM 其中 \(W_1\) 是hash策略,不是要学的参数,特别的地方就是hash策略.文章通过hash进行降维,本质上还是bag of words模型.最大化有点击的样本的概率. CDSSM 想...

CTC原理

leihao阅读(11259)评论(0)

不搞语音识别得人开这个论文确实有点费劲,结合上图,思考一下语音识别的场景,输入是一段录音,输出是识别的音素, 输入的语音文件的长度和输出的音素个数之间没有一一对应关系,通常将语音文件「分片」之后,会出现多对一的关系。这个场景在「翻译问题」和...

语音识别解码器(2)—WFST基本操作

chendajun阅读(5499)评论(0)

上篇简单介绍了FSA、FST、WFSA、WFST、半环的概念和区别,本篇将介绍WFST的基本操作和转移器的合并。 闭包、并联、串联 自动机理论中包含3个基本操作:Kleene闭包、并联、串联,对于给定的两个WFST为 \(T_{A}\) 见...

CTPN原理

leihao阅读(8874)评论(0)

文章思路很不错,利用了文字作为object本身的提点,设计固定宽度的anchor,减少学习的空间。 网络结构 查看大图 特点 不是在字的级别,最终输出是在行的级别 对每一行,每一个feature map位置,固定需要回归的框的宽度为16像素...

DeepText原理

leihao阅读(3906)评论(0)

几乎是Faster R-CNN的翻版,论文见参考部分。。 网络结构 论文的方法是通过生成字(word)级别的检测框,为了生成高召回的候选框,提出了Inception-RPN结构。 特点 先验候选bounding box,生成24种,保证宽度...

tensorflow-serving源码理解

huangzhongjie阅读(10652)评论(2)

本文主要介绍利用训练好的inception模型提供识别服务的流程,结合tensorflow serving教程具体介绍模型保存及其提供服务的实现代码。 思维导图及实现流程: 思维导图   导出tensorflow模型 [crayo...

Grammar as a Foreign Language

leihao阅读(2326)评论(0)

原始论文:《Grammar as a Foreign Language》 如论文的标题,论文特别的地方是将「句法分析」这件事变为一个「翻译」问题。 不了解RNN和LSTM的可以先看RNN(Recurrent Neural Networks)...

Manhattan LSTM Model

leihao阅读(2052)评论(0)

文章《Siamese Recurrent Architectures for Learning Sentence Similarity》提出来一个计算句子相似度的方法;求两个句子的相似度在很多地方需要用到,例如文章的聚类,相似文章的推荐等。...

Mask R-CNN原理

leihao阅读(4524)评论(0)

先要了解一下FCN结构和Faster R-CNN原理。 整体逻辑图 在Faster R-CNN上面进行修改,添加了一个分支,这个分支最后也放到统一的损失函数中进行学习。 特点 将分类、检测、实体切分(instance segmentatio...

关注大数据算法在工业界应用

本站的GitHub关于本站