摘要: http://www.2cto.com/kf/201307/226576.html,这个是Sigmoid函数,在这个回归过程中非常重要的函数,主要的算法思想和这个密切相关。这个函数的性质大家可以自己下去分析,这里就不细说了。然后我们说明下流程,首先我们将每个特征都乘以一个回归系数,然后将这个总和带入上面的函数,进而得到一个数值在0~1的值,则大于0.5归到1类,小于0.5归到0类。但是这么多维特征的系数该怎么选取成了我们最关心的问题。这样我们就构建了一个二分类的模型,判定一个东西是不是某个分类。迭代使用的微分公式:我们沿着这个进行迭代求最优权重参数,这样出来的参数就可以出来了。对于二维空间的我 阅读全文
posted @ 2014-04-04 18:44 Django's blog 阅读(404) 评论(0) 推荐(0)
摘要: Logisticregression(逻辑回归)是当前业界比较常用的机器学习方法,用于估计某种事物的可能性。比如某用户购买某商品的可能性,某病人患有某种疾病的可能性,以及某广告被用户点击的可能性等。(注意这里是:“可能性”,而非数学上的“概率”,logisitc回归的结果并非数学定义中的概率值,不可以直接当做概率值来用。该结果往往用于和其他特征值加权求和,而非直接相乘)那么它究竟是什么样的一个东西,又有哪些适用情况和不适用情况呢?一、官方定义:,Figure1.Thelogisticfunction,withzonthehorizontalaxisandƒ(z)ontheverticalaxi 阅读全文
posted @ 2014-04-04 17:03 Django's blog 阅读(403) 评论(0) 推荐(0)
摘要: 你不是改个参数几个队一起刷的话应该还好吧我当初就觉得这样不好,后面多半要出乱子。浙大宣讲问主办方,现在这种情况,几条简单规则就能刷到6,我要是把这几条简单的规则告诉别人,那别人不都挤到前面,那赛季1不就没意义了?然后还有mj的问题。宣讲的老师说,那你觉得现在极限是多少呢?是7么。mj这种问题都是小问题后来算者说得好,规则确实能做得比较好,怎么结合规则做出更好的模型才是王道,模型不如规则只能说模型做的不够好。这个对我影响还蛮大的,也让我好好反思了一下。我现在靠LR做到6.8,基本也没做规则了,而是想如何用以前淘宝有个做CTR预估的MLR的思路结合商品类目和用户定向做更好的结合规则的LR。我把我p 阅读全文
posted @ 2014-04-04 15:20 Django's blog 阅读(691) 评论(0) 推荐(0)
摘要: Python代码importcsv#从文件读取reader=csv.reader(file(srcFilePath,'rb'))forlineinreader:#忽略第一行ifreader.line_num==1:continue#line是个list,取得所有需要的值type=line[0]#写入文件writer=csv.writer(open(targetFile,"wb"),quoting=csv.QUOTE_ALL)#传入listwriter.writerow(["121","121"])#传入2纬listwr 阅读全文
posted @ 2014-04-04 00:04 Django's blog 阅读(675) 评论(0) 推荐(0)