理解与应用：机器学习中的特征与特征选优详解

最编程 2024-07-23 18:45:01

...

特征（Feature）和特征选择(Feature Selection)

概念解释

在机器学习中，将属性称为“特征（Feature）”，对当前学习任务有用的属性称为“相关特征（Relevant Feature）”，没有什么用的属性称为“无关特征（Irrelevant Feature）”。从给定的特征集合中选择出相关特征子集的过程，称为“特征选择（Feature Selection）”

特征选择是一个重要的数据预处理过程。在现在的机器学习中，获得数据之后通常先进行特征选择，此后再训练学习器。

特征选择过程必须确保不丢失重要特征，否则后续学习过程会因为重要信息的缺失而无法获得好的性能。给定数据集，若学习任务不同，则相关特征很可能不同。

另外，有一类特征称为“冗余特征（Redundant Feature）”，它们所包含的信息能从其它特征中推演出来。那么，去除冗余特征会减轻学习过程的负担。

特征选择的目的

在机器学习的实际应用中，特征数量往往较多，其中可能存在不相关的特征，特征之间也可能存在相互依赖，容易导致如下的后果：

特征个数越多，分析特征、训练模型所需的时间就越长。
特征个数越多，容易引起“维度灾难”，模型也会越复杂，其推广能力会下降。

特征选择能剔除不相关(irrelevant)或亢余(redundant )的特征，从而达到减少特征个数，提高模型精确度，减少运行时间的目的。另一方面，选取出真正相关的特征简化了模型，使研究人员易于理解数

上一篇：如何运用skimage.feature模块的功能详解

下一篇：特性与功能：详解两者之间的区别

理解与应用：机器学习中的特征与特征选优详解

特征（Feature）和特征选择(Feature Selection)

概念解释

特征选择的目的

理解物体检测中的FPN网络：特征金字塔网络详解与学习笔记

Matlab实现的深度学习中的特征金字塔解构与应用

深度学习里的神奇金字塔：Matlab中的特征金字塔与独特数据结构详解

理解与应用：机器学习中的特征与特征选优详解

2020年12月9日：深入理解深度学习中的滤波器、特征映射与卷积层详解

什么是机器学习中的特征空间（Feature Space）与用户空间（User Space），以及它们与数据空间的关系解释

玩转机器学习里的数学：理解特征向量与矩阵对角化的奥秘

深入理解sklearn中的XGBModel：特征重要性详解、plot_importance功能解析与实用操作指南