2022年12月11日 机器学习 阅读时间 1 分钟 AdaBoost、GBDT 和 XGBoost 的联系与区别 各类 Boost 方法是基于树模型的集成模型,理解它们的联系与区别有助于理解各个算法的优劣。 继续阅读
2022年12月11日 机器学习 阅读时间 2 分钟 自定义交叉验证的样本划分方法 交叉验证是缓解模型过拟合的手段之一。本文以 XGBoost 算法为例,介绍了如何自定义交叉验证中划分训练集和验证集的方法。 继续阅读
2022年12月10日 机器学习 阅读时间 1 分钟 XGBoost 推导 XGBoost 中的结构分数以及理解它对于构建 XGBoost 模型的作用。转载一篇写得非常棒的介绍 XGBoost 的文章,真正的通俗易懂。 继续阅读
2022年12月7日 统计 阅读时间 1 分钟 方差分解公式 应用重期望公式,证明方差分解公式。 $$ \operatorname{Var}(X)=\operatorname{Var}(\mathrm{E}[X \mid Y])+\mathrm{E}[\operatorname{Var}(X \mid Y)] $$ 继续阅读
2022年12月4日 机器学习 阅读时间 5 分钟 使用 Gradient Boost Decision Tree 进行回归预测 使用 GBDT 进行回归预测,并与决策树进行对比。 GBDT 的损失值随迭代次数的变化 继续阅读