欢迎光临 x-algo
关注算法在工业界应用
Hi, 这是一个关注大数据算法在工业界应用的网站

模型

第2页

LambdaRank和LambdaMART原理

leihao阅读(6316)评论(0)

这部分知识已经有很多地方讲的比较清楚,我这里纯粹是记录一些方便我回忆的要点。 pair-wise error 定义 pair-wise error 表示一个排列中,抽查任意两个item,一共有 \(C_n^2\) 种可能的组合,如果这两个i...

RankSVM原理

leihao阅读(7294)评论(3)

RankSVM是使用SVM模型解决Learning to rank问题的Pair-wise方法,和传统的算法的区别就是样本的构造和lable的意义有所改变。将原来的两个样本 \(x_i,x_j\) 表示一个训练数据, \(x_i\) 排名好...

XGBoost原理

leihao阅读(13186)评论(1)

了解XGBoost之前,默认你已经比较了解CART算法。 预估函数 XGBoost是对GBDT的改进,所以类似GBDT的预估函数,作为「前向加法」模型,XGBoost的预估函数没有特别的地方,具体为: \(\hat{y}_i =\phi(x...

决策树

leihao阅读(2033)评论(0)

作为一种直观并且实用的树形结构的分类/回归方法,决策树的叶子节点和非叶子节点都含有很多有用的信息,不仅单棵树可以作为分类/回归的模型独立使用,也可以将多棵树组合起来,同时在特征的选择上也有巨大的实用性。 特征空间 作为非线性模型,决策树最终...

神经网络(Neural Network)实现

leihao阅读(6225)评论(0)

为了更好的理解deep learning,自己动手实现一个神经网络还是很有必要的。 本文先生成了一个数据集,然后使用LR(逻辑回归)做了一下分类,然后绘制出来了LR的分类面(一条直线)。 接着用一个三层的神经网络训练,从而训练出来一个非线性...

CRF++中文分词

leihao阅读(10113)评论(22)

使用人民日报的语料,为了方便切割,将其中的\t替换为了空格,语料直接下载:人民日报语料。生成的crf测试和训练数据:点击-训练和测试数据下载(6tag版本) 对于语料有嵌套的标注,例如:[中央/n 电视台/n]nt,为了处理方便,只考虑最细...

HMM(hidden Markov model)隐马尔科夫模型

leihao阅读(2795)评论(0)

隐马尔科夫模型(后面简称隐马)适用于标注问题的统计学习模型,属于生成模型,隐马的三个基本问题:概率计算问题、算法学习问题、预测问题。隐马在分词、词性标注、语音识别等领域有这广泛的应用。 未经允许不得转载:大数据算法 » HMM(...

条件随机场(CRF)理论及应用

leihao阅读(8902)评论(0)

条件随机场(CRF)是给定一组输入随机变量条件下,求另一组输出随机变量的条件概率分布的模型;其特点是假设输出随机变量构成马尔科夫随机场(后面解释),条件随机场可以用于不同的预测问题,对自然语言处理过程主要是线性(linear chain)条...

关注大数据算法在工业界应用

本站的GitHub关于本站