Li Shen Blog

Stay hungry, stay foolish.

【转】StandardScaler/MinMaxScaler/Normalizer之间的区别

marscep

最近在做机器学习的项目,用到了MinMaxScaler,在此复习一下StandardScaler/MinMaxScaler/Normalizer之间的区别。

一、数据标准化
StandardScaler (基于特征矩阵的列,将属性值转换至服从正态分布)
标准化是依照特征矩阵的列处理数据,其通过求z-score的方法,将样本的特征值转换到同一量纲下
常用与基于正态分布的算法,比如回归

二、数据归一化
MinMaxScaler (区间缩放,基于最大最小值,将数据转换到0,1区间上的)
提升模型收敛速度,提升模型精度
常见用于神经网络

三、Normalizer (基于矩阵的行,将样本向量转换为单位向量)
其目的在于样本向量在点乘运算或其他核函数计算相似性时,拥有统一的标准
常见用于文本分类和聚类、logistic回归中也会使用,有效防止过拟合

 

参考资料:标准化和归一化什么区别?- 知乎


————————————————
版权声明:本文为CSDN博主「marscep」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/u010471284/article/details/97627441

7人读过
生物信息 工具/方法/算法 Python
Dec. 30, 2022, 11:16 a.m.

评论:

登录后方可评论,点击登录注册

评论列表:

暂无评论。

苏公网安备 32050602011302号

苏ICP备2020062135号-1
Copyright© Li Shen. All rights reserved.