当前位置:首页 >> 脚本专栏

基于python实现ROC曲线绘制广场解析

ROC

结果

基于python实现ROC曲线绘制广场解析

源数据:鸢尾花数据集(仅采用其中的两种类别的花进行训练和检测)

Summary

features:['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']

实例:[5.1, 3.5, 1.4, 0.2]
target:'setosa' 'versicolor' (0 , 1)

采用回归方法进行拟合得到参数和bias

model.fit(data_train, data_train_label)

对测试数据进行预测得到概率值

res = model.predict(data[:100])

与训练集labels匹配后进行排序(从大到小)

    pred labels
68 0.758208    1
87 0.753780    1
76 0.745833    1
50 0.743156    1
65 0.741676    1
75 0.739117    1
62 0.738255    1
54 0.737036    1
52 0.733625    1
77 0.728139    1
86 0.727547    1
74 0.726261    1
58 0.725150    1
71 0.724719    1
36 0.724142    0
14 0.723990    0
31 0.721648    0
41 0.720308    0
72 0.717723    1
79 0.712833    1
97 0.705148    1
51 0.702838    1
35 0.702203    0
98 0.701731    1
92 0.701106    1
82 0.700661    1
53 0.700465    1
18 0.699350    0
16 0.696915    0
64 0.693333    1
..    ...   ...
33 0.658937    0
96 0.656761    1
30 0.656279    0
57 0.655673    1
4  0.652616    0
85 0.648620    1
59 0.648586    1
19 0.646965    0
70 0.646262    1
88 0.644482    1
8  0.643191    0
38 0.642704    0
3  0.640933    0
55 0.640630    1
47 0.640444    0
95 0.639552    1
13 0.639050    0
22 0.638485    0
29 0.635590    0
90 0.634376    1
37 0.632224    0
6  0.631119    0
46 0.630037    0
11 0.629718    0
66 0.627807    1
42 0.624795    0
44 0.621703    0
32 0.614932    0
24 0.603874    0
84 0.603249    1

计算训练集中正确的个数与非正确的个数

运用一下的算式进行TPR和FPR的计算

index = 0
for i in sorted_mat.values:
  if i[1] == 0:
    TPR.append(TPR[index])
    FPR.append(FPR[index] + 1.0/F_num)
  else:
    TPR.append(TPR[index] + 1.0/T_num)
    FPR.append(FPR[index])
  index += 1

最后进行TPR和FPR的描绘

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。