大数据算法

欢迎光临 x-algo
关注算法在工业界应用
Hi, 这是一个关注大数据算法在工业界应用的网站

最新发布 第5页

CNN

GoogLeNet介绍

leihao阅读(5601)评论(1)

 单模型效果 比赛排名 图片来源:http://www.qingpingshan.com/m/view.php?aid=143436 Inception v1 目标 人类的大脑可以看做是神经元的重复堆积,Inception网络存在的原因就是...

CNN

深度残差网络

leihao阅读(2284)评论(0)

现状 在实际中,发现网络的深度和模型的性能(效果)并非一直是正相关的关系,导致这个问题的可能原因: 很有可能是梯度消失/爆炸引起的 新加的层表达能力有限,对前面几层学好的模型是一种损害,所以可能存在一个「最优层数」。(作者倾向这个原因) 为...

推荐系统

推荐系统的EE问题及Bandit算法

wang, xianfeng阅读(7300)评论(0)

经常听身边的人说起使用推荐系统的感受,“某宝某东就是看什么给推什么”,使用者对推荐系统产生厌倦;也有听做推荐系统的同学抱怨推荐的冷启动问题,如何去尝试新用户的兴趣点,尝试到什么时候地步才算真正掌握了用户的兴趣,用户的兴趣发生改变如何灵活的调...

调度系统

Borg介绍

leihao阅读(533)评论(0)

功能 Google的Borg系统是一个集群管理软件,实现下面三个功能 隐藏对集群资源管理、失败处理的细节,让开发者更加关注自己的程序本身 高可靠和可用 更方便的在多机器上面运行job(程序/服务)   两类作业 我们在集群上面运行...

模型

GBDT快速计算可以想到的

leihao阅读(813)评论(0)

优化树的存储 速度想要提升,将树存成数组是比较好的选择,所以可以构造一个大数组存放树中的节点,然后用另外一个int数组表示root的下标即可,下图为一个存储实例: 上图中,数组存储是按照层次存储了,其实可以根据叶子节点上面的「样本量」进行调...

最优化

rabit和ps-lite

leihao阅读(1387)评论(0)

随便写一点吧,这几天大概了解了一下DMLC的两个参数服务器,rabit和ps-lite。很早之前接触过vw,所以对AllReduce的工作模式并不陌生,专门优化神经网络的parameter server也大概了解,不过看到具体说明文档和论文...

数学

特征值和特征向量

leihao阅读(841)评论(0)

通过本文,可以更加好的理解特征值的「物理」意义,以及为什么研究特征值和特征向量。 不变子空间 「算子」是一个向量空间到其自身的线性映射,此映射记为: \(L(V)=L(V,V)\) 。为了更好地理解算子,先定义一下直和分解: 设 \(T \...

线性代数

线性映射

leihao阅读(1214)评论(0)

前文对向量空间进行了各种定义,跟人感觉比较枯燥和不实用。本文的内容开始渐入佳境,有很多有意思的结论。比如为什么矩阵乘法的定义那么奇怪,以及对映射的一些分类。 上图来源于此处 定义 线性映射在有的教材中也被成为「线性变换」,映射有线性和非线性...

线性代数

向量空间

leihao阅读(539)评论(0)

线性代数的研究对象是在「限维度」的空间的「线性映射」. 向量空间定义 向量空间(vector space)就是带有「加法」和「标量乘法」的集合V,使得下面性质成立: 交换性:对所有的 \(u,v \in V\) ,都有 \(u+v=v+u\...

关注大数据算法在工业界应用

本站的GitHub关于本站