多数情况下,需要对数据集进行归一化处理,再对数据进行分析
#首先,引入两个库 ,numpy,sklearn from sklearn.preprocessing import MinMaxScaler import numpy as np #将csv文件导入矩阵当中 my_matrix = np.loadtxt(open("xxxx.csv"),delimiter=",",skiprows=0) #将数据集进行归一化处理 scaler = MinMaxScaler( ) scaler.fit(my_matrix) scaler.data_max_ my_matrix_normorlize=scaler.transform(my_matrix) #最后的my_matrix_normorlize 实现了归一化my_matrix_normorlize
完整未解释代码:
from sklearn.preprocessing import MinMaxScaler import numpy as np my_matrix = np.loadtxt(open("xxxx.csv"),delimiter=",",skiprows=0) scaler = MinMaxScaler( ) scaler.fit(my_matrix) scaler.data_max_ my_matrix_normorlize=scaler.transform(my_matrix)
以上这篇python 实现对数据集的归一化的方法(0-1之间)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。