新智元报导
来历:reddit
修改:大明
【新智元导读】近来Reddit上有网友发问,作为数据竞赛的头牌,为什么Kaggle的奖金这么低?取胜选手的模型不是能给企业带来很大经济价值吗?为什么资助企业这么抠门呢?跟帖谈论火热,整体来说,我们以为Kaggle对企业的出产价值不大,可是对人才招聘和广告宣扬价值不小。
近来,在Reddit上呈现了一个“知乎式”的问题:
为什么Kaggle数据竞赛的奖金这么低?比方说最近这个由Lyft资助的项目,奖金只要12000美元。
一个比当时基线功用更优异的新模型,或许会带来巨大的价值,那为什么主办方和资助这些应战的公司还如此小气?
楼主既没有模型要展现,也没有论文要共享,看起来便是有了困惑和不解,这个问题的亮点在跟帖网友的谈论。
从点赞较多的几个谈论来看,几个代表性定见大概是:Kaggle竞赛的性质和选手的参赛首要意图都不是奖金,而是优胜背面带来的其他时机。
比方企业可以打广告和招人
我觉得Kaggle数据竞赛现已越来越不像一项大奖赛了,更像是一场资助企业的广告,获奖者便是企业的招聘人才池。并且其实参赛者或许并没有取得实在的原始数据。
参赛者可以取得曝光度和offer
得了奖,有了曝光度,offer拿到手软,还要什么奖金!
也有质疑效果的实践含义的,或许仅仅调参水平比他人好一点点......
我觉得,许多效果便是超参数调参的效果,便是比之前的效果提升了0.1%之类的,实践能有多大含义呢。
企业并不能将优胜效果用在出产上,不要把Kaggle奖金当作“外包劳务费”。
有些人好像以为Kaggle就像外包商标规划的网站相同,你在网站上发布规划使命,向终究的采用计划付出酬劳。假如真是这样,参赛者提交的效果的确是可交给的,那么12000美元的奖金或许的确有点偏低。
但实践上,Kaggle竞赛的效果都是不可交给的(不符合出产实践的条件和质量要求)。并且这些效果也不会为组织者带来任何技能上的竞赛优势,由于效果是揭露的,竞赛对手相同可以获取这些解决计划。
Kaggle更像是国际象棋。可以当作是有公司资助了一项奖金竞赛,社区中的每个人都可以看到国际象棋大师们精彩的棋局。这笔钱实践上是奖金,而不是外包计划的劳务费。假如你觉得奖金太低,可以挑选不参与啊。信任我,你不参与,后边有的是人排队参与。
关于竞赛组织者来说,大部分技能价值并非来自获奖者的效果模型,而是来自社区和论坛上对这些效果的谈论:比方关于数据走漏、模型背面的思路,对新学习算法的功用展现等等。
获奖者的效果仅仅供给了一个非常好的基准,便于人们了解实践出产中使用的模型与最佳解决计划的挨近程度。剩余的价值恐怕只在于资助者自身的宣扬和人才招聘了。
最终,从参赛者的视点来看:我从前经过数据科学竞赛赢得了大约10000美元奖金,结合耗时状况简略算一算,每小时才4美元。但对我来说,这个效果的直接价值和时机可就大得多了。我在Kaggle竞赛上得了奖,效果许多大公司都联络我,给我发offer,无论是高薪的职位仍是咨询服务,对我而言或许带来的时机都是巨大的。
所以说,别说是12000美元,便是只要1美元,我依然很愿意参与。这就不是钱的问题,但实践上……仍是钱的问题,更别提取胜计划的论文可以招引多少引证数了,发过论文的都懂的。
当然,也不都是理性谈论,也有看不上Kaggle过来开嘲讽的:
啊?莫非Kaggle竞赛不是都把那么几个相同算法丢数据集上实验的吗?
不过很快就被人怼了回去:
这位兄弟,我主张你参与一次Kaggle竞赛,然后拿你说的“那么几个相同的算法”试一试,看看最终会不会被教做人。
别的还有嘲讽水平更高的,讲话风格可以说是适当“贴吧”了
嗯嗯,我来理一基层主的思路,并且我觉得不止层主一个人是这个思路:
“别看我Kaggle竞赛成果不可,其实我机器学习水平很牛的,所以Kaggle并不能反映机器学习才能。你看那些参赛的人,其实做的都是同一件事,最终效果便是看运气的,做了半响低智商的苦力活,最终效果才进步0.1%,就一群骗子罢了。”
是这意思不?
无论如何,与机器学习相关岗位高高的均匀薪资比较,Kaggle这个奖金水平的确有点破旧。关于为什么Kaggle竞赛奖金低,上面几位说的也算比较到位了。
不知各位怎么看?
Reddit谈论帖:
https:///r/MachineLearning/comments/d50lr3/d_why_are_kaggle_prizes_so_low/