Linear/Logistic/Softmax Regression对比

Linear/Logistic/Softmax Regression是常见的机器学习模型,且都是广义线性模型的一种,有诸多相似点,详细对比之。

Published: 24 Mar 2019

多分类模型

分类是常见的机器学习任务,本文简单介绍分类的几种经典形式,即二分类、多分类和多标签分类。

Published: 23 Mar 2019

过拟合及解决办法

过拟合是机器学习任务中非常普遍的现象,模型不仅拟合了样本的普遍规律,还进一步拟合了噪声。

Published: 14 Mar 2019

RecSys中的Graph Embedding

阿里在2018KDD上发表一篇关于Graph Embedding在推荐方向应用的论文:Billion-scale Commodity Embedding for E-commerce Recommendation in Alibaba,工程实践价值较高,简记论文部分内容。

Published: 12 Mar 2019

决策树算法

关于经典决策树算法ID3、C4.5及CART树的部分细节梳理。

Published: 08 Mar 2019

Random Forest OOB

随机森林模型基于Bagging(Boostrap Aggregation)思想,学习多棵树,聚合结果来减少模型的variance。其中模型的diversity非常重要,一种增加diversity的手段是对原始数据集采样,然后在采样后数据集上训练模型。

Published: 06 Mar 2019

DeepWalk

Published: 03 Mar 2019

损失函数清单

损失函数(Loss Function)用来估量模型的预测值 $\hat y = f(x)$ 与真实值 $y$ 的不一致程度。这里做一个简单梳理,以备忘。

Published: 02 Mar 2019