博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
machine learning in coding(python):使用贪心搜索【进行特征选择】
阅读量:6581 次
发布时间:2019-06-24

本文共 765 字,大约阅读时间需要 2 分钟。

print "Performing greedy feature selection..."score_hist = []N = 10good_features = set([])# Greedy feature selection loopwhile len(score_hist) < 2 or score_hist[-1][0] > score_hist[-2][0]:    scores = []    for f in range(len(Xts)):        if f not in good_features:            feats = list(good_features) + [f]            Xt = sparse.hstack([Xts[j] for j in feats]).tocsr()            score = cv_loop(Xt, y, model, N)            scores.append((score, f))            print "Feature: %i Mean AUC: %f" % (f, score)    good_features.add(sorted(scores)[-1][1])    score_hist.append(sorted(scores)[-1])    print "Current features: %s" % sorted(list(good_features))

注意还没结束:

# Remove last added feature from good_featuresgood_features.remove(score_hist[-1][1])

from kaggle

转载地址:http://tonno.baihongyu.com/

你可能感兴趣的文章
java entry
查看>>
JQuery.Ajax()的data参数类型
查看>>
8.1.3 在BroadcastReceiver中启动Service
查看>>
【python】入门学习(七)
查看>>
java.io.File中的pathSeparator与separator的区别
查看>>
MVC3中 ViewBag、ViewData和TempData的使用和区别
查看>>
泛型Dictionary的用法详解
查看>>
明晰三种常见存储技术:DAS、SAN和NAS
查看>>
ContentProvider简单介绍
查看>>
11.struts2文件上传
查看>>
样条之CatmullRom
查看>>
grep命令參数及使用方法
查看>>
Visual Studio 2014 CTPs 下载 和C# 6.0 语言预览版介绍
查看>>
js混淆 反混淆 在线
查看>>
Linux ftp
查看>>
大规模分布式数据处理平台Hadoop的介绍 一种可靠、高效、可伸缩的处理方案
查看>>
java代理ip有效检测
查看>>
总结5种比较高效常用的排序算法
查看>>
独立思考者模型:避开思维误区的沼泽 我们很多时很蠢
查看>>
解决简单恢复模式下产生的日志增长
查看>>