在我们使用一些数据的过程中,我们想要打乱数组内数据的顺序但不改变数据本身,可以通过改变索引值来实现,也就是将索引值重新随机排列,然后生成新的数组。功能主要由python中random模块的sample()函数实现。
sample(population, k) method of random.Random instance Chooses k unique random elements from a population sequence or set.
下面的代码实现的是打乱iris数据,iris数据是网上下载的csv格式文件,相信大家不陌生的了,原始数据是三种鸢尾(iris)顺序排列的,三种花分别是:setosa,versicolor 和 virginica ,记录的数据有SepalLengthCm(花萼长度), SepalWidthCm(花萼宽度), PetalLengthCm(花瓣长度), PetalWidthCm (花瓣宽度)
在做聚类分析的时候曾经用到过iris数据,当然,如果安装了scikit learn 模块的话,可以通过
from sklearn import datasets iris = datasets.load_iris()
获取
参考链接:http://scikit-learn.org/stable/auto_examples/datasets/plot_iris_dataset.html
下面的程序实现打乱iris的数据顺序:
import pandas as pd import random as rd # 导入random模块,使用里面的sample函数 from pylab import * iris = pd.read_csv('D:\\Iris.csv') a1=reshape(iris['Id'],[150,1]) a2=reshape(iris['SepalLengthCm'],[150,1]) a3=reshape(iris['SepalWidthCm'],[150,1]) data=c_[a1,a2,a3] idx=rd.sample(range(150),150) iris = data[idx] # 打乱顺序,这里只选取了花萼长度和宽度这两个特征值
2017/7/10 updated
打乱顺序的方法还可以使用random.shuffle(iterable),这样会直接改变iterable的顺序,shuffle 是洗牌的意思,顾名思义,需要注意的是random.shufle()函数没有返回值,如果写成
mylist = random.shuffle(list1)
将不会得到任何结果
以上这篇对Python random模块打乱数组顺序的实例讲解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。