探索决策树模型-2. 揭秘决策树的训练过程

最编程 2024-08-12 12:39:31

...

我们知道决策树在进行节点分裂前时，会遍历训练集计算一个最优分裂点，这就要求决策树模型必须遍历完所有训练集，尽管这个操作可以不必完全在内存中完成（例如XGBoost的大规模训练解决方案），但是当面对日益增长的海量数据时，这种必须遍历完所有数据的缺陷也彰显出来

同时，我们也会清楚的了解，目前的决策树的最优权重都是基于目前的训练集的，一旦目标数据集发生了变化，这样的树模型就不再适用(想想是不是距离智能还很遥远？)