本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

码报:Kaggle获奖者自述比赛求生指南:我们如何“穿越(9)

时间:2017-08-11 21:04来源:118论坛 作者:本港台直播 点击:
Kyle和我们队伍里的一名队员的ID重名,是上一次卫星图像比赛的冠军,在我们加入比赛的时候,他已经在第一名的位置盘踞许久。不过感觉他可能计算力资

Kyle和我们队伍里的一名队员的ID重名,是上一次卫星图像比赛的冠军,在我们加入比赛的时候,他已经在第一名的位置盘踞许久。不过感觉他可能计算力资源不是很丰富,最后一周有点乏力,最后Private LB刚好留在金牌区内。

是上一次卫星图像比赛的第四名,好像是一个做图像的公司。

ZFTurbo是图像类比赛活跃的GrandMaster(Kaggle头衔),上一次卫星图像比赛的亚军,后面还与当时排名第三的Stanislav Semenov进行了组队,这支队伍十分强大。

他们的队名也很会玩,一开始懒得起名,直接叫做Team Name,他们在最后一天猛地提升到达了Public LB顶端之后,就改名为Russian Bears,一个带着强烈战斗民族色彩的队名,这让我们严肃地考虑要不要改名为Chinese Panda / Chinse Dragon / Make China Great Again之类的,嗯,不过最后并没有改。

他们最后是Private LB第三名,留在了奖金池内。ZFTurbo赛后发布的一个拼图Trick也十分有趣,方法是找到一副图像切片周围邻接的切片,然后利用周围切片作为上下文,一起对中央图像进行预测。这个trick貌似是ZFTurbo在以往就惯用的套路了,看来他很热衷于拼图。

team-amazon-forest这支队伍在评论区从头到尾都十分活跃,尤其是Heng CherKeng,在讨论区给大家提供了很多探索结果和技术细节。

我们早期也从中获得不少启发,非常感谢他的分享,赛后讨论区也出现了对他的感谢帖。不过可能因为他分享了太多,后期被后面很多新晋队伍超过了,最后掉出金牌区。

Urucu队里有Kaggle积分全站排名第一的Gilberto Titericz Junior,他们在比赛结束前十几分钟冲到了Public LB第三的位置,但却在Private LB中掉出了金牌区,十分可惜。

Clear Sky队伍里可能有一到两个华人,实力也十分强劲,也是我们关注的对象。

bestfitting是一位名字开挂的选手,best fitting(最好的拟合),最后从Public LB的第九直接上升到了Private LB的第一,确实是best fitting。他的赛后方案总结也包含了很多值得学习的地方。

4.3 最后的战斗、结果分析和伟大的随机性

我们因为参赛比较晚,经验相对不足,一直到最后一天都还有很多Ensemble方案没有来得及验证。再加上机房在最后三天因为暴雨短路停了一天,我们到比赛结束前几个小时才基本跑完了想要跑的大部分单模型。

在等待单模型新鲜出炉的同时,队里几乎所有人都在通宵地验证分析各种Ensemble方案。

在最后一天大家都只剩下5次Submission的机会,使用都十分谨慎,不像之前那么随意。一整个白天我们都在线下实现和验证Ensemble方案,压着不提交。

我们还写了一个脚本,时刻监控着Public LB的变化和前十几名的Submission剩余次数,看到排名靠前的很多队伍也非常沉得住气,前面12个小时基本都没有提交,可以说变数非常地大。不过由于我们的分数与第二名的差距足足等于第二名到第九名的差距,所以我们也不怎么着急。

然而,Russian Bears仅仅第一次提交就打破了我们的平静,他们一举从0.93320升到了0.93348,看上去跟我们的分数0.93348是一样的,但是在后面没显示出来的小数位上赢了,占据第一,给了我们很大压力。我们心想,第一次提交就这么夸张,后面那还得了?不过他们后面剩下的四次尝试再也没有提升,让人暂时松了一口气。

很快我们也尝试提交了两次,分别是不同的Ensemble方案,然而都没能打破记录,当时非常的紧张。经过讨论,我们决定暂时先不冒险,而是想办法回滚到前一天的代码,在那份代码上我们取得了当前的最佳分数0.93348。

但是由于之前太过大意,管理这份实现的没有记录下来究竟是哪一次git commit上跑出了最佳效果,因为觉得后面肯定会跑出更好的结果,却没想到现在要靠这份Ensemble代码来救场。

中间花了几个小时,根据git log上面的提交时间、单模型文件的修改时间、微信聊天记录之间的比对,该队员终于戏剧性地恢复了之前的代码。

之前这份ensemble方案仅仅使用了57个单模型,加入新的单模型之后,不出意外地提升了,达到0.93449,重回Public LB第一。我们最后是用了64个模型进行Ensemble,一个程序员看起来十分舒服的数。

后面我们又在这份救场代码上尝试了两种改进,但是都没有再提升了。最后一份Submission文件生成完后,距离比赛结束还剩一个小时,我们非常恶趣味地等着看Russian Bears队伍的最后两次提交,然而他们提交了一次之后就不动了。

一直等到最后半个小时我们实在等不下去,把最后一份Submission交了,结果才过了一分钟他们也交了最后一个的Submission,似乎也是在恶趣味地等着我们。

Urucu也在最后十几分钟的时候提交了一个0.93444,到达第三,成功加入Public LB 0.93440+ 俱乐部。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容