本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

码报:【j2开奖】未来中国版Kaggle锋芒初显 :CCF大数据与计算智能大赛完美收官

时间:2016-12-29 12:34来源:天下彩论坛 作者:118KJ 点击:
:COO、执行总编、主编、高级编译、主笔、运营总监、客户经理、咨询总监、行政助理等 9 大岗位全面开放。 简历投递:j [email protected] HR 微信: 13552313024 新智元为COO和执行总编提供

  :COO、执行总编、主编、高级编译、主笔、运营总监、客户经理、咨询总监、行政助理等 9 大岗位全面开放。

  简历投递:j[email protected]

  HR 微信:13552313024

  新智元为COO和执行总编提供最高超百万的年薪激励;为骨干员工提供最完整的培训体系、高于业界平均水平的工资和金。

  加盟新智元,与人工智能业界领袖携手改变世界。

  【新智元导读】2016年12月25日,“2016CCF大数据计算智能大赛”(BDCI)正式落幕。多位大数据计算智能领域顶尖强者,用作品赢得了行业专家的一致认可,也体现了大数据发展的蓬勃活力。

  2016年12月25日,第四届“大数据与计算智能大赛(Big Data & Computing Intelligence Contest, BDCI)”在青岛完美收官,各项、奖金也名花有主,开奖,获奖队伍在圣诞节的衬托下更添喜悦。从大赛启动到决赛嘉年华,整整历时九十天,虽然比儒勒·凡尔纳笔下的福格环游地球还多花了十天,但参赛的一万余名“夜猫子”环游比特世界的征程是比走遍山川美景更为独特的智力冒险。

码报:【j2开奖】未来中国版Kaggle锋芒初显 :CCF大数据与计算智能大赛完美收官

  决赛队伍答辩现场

  大赛规格猛升,队伍构成更加多元

  与上届相比,今年的大赛规模实现了爆发式增长,参与人数、队伍数、境外高校数以及提交作品数均比上年增长3.3倍以上,创下历史新高。“我们又回来了-美林数据”等多个战队的选手之前都参与过多次大数据赛事,且取得了非常好的成绩,为本次大赛增添了几缕“星光”。

  从地域、校园、性别等的分布都可以发现参赛队伍多元化特征非常明显。地域上不仅覆盖全国34个省、自治区和直辖市,更吸引了港澳及美国、英国、法国、日本、澳大利亚的海外参赛者。学生来源几乎覆盖了国内所有985/211高校以及众多普通高校、地方院校,甚至包括数个中学。工业界选手也有增多的趋势。性别上,来自两名北京大学“女汉子”组成的“Foo & Bar”队,取得了CCF最佳技术创新奖及对应赛题的一等奖,并且其他获奖参赛队伍骨干中也经常能看到女生的身影。

  队名显现活力与趣味。参赛队伍的名称可谓“八仙过海,各显萌通”,比如“打酱油`拎壶冲”、“401数据挖掘施工队”、“SmartRookie”等等,让台下观众都有评一个“最有创意队名奖”的冲动了,当然,名字让人印象深刻的“诗人都藏在水底”还凭借独特的算法商业性,获得了CCF最佳商业潜力奖及对应赛题一等奖。

  揭开数据面纱,深度挖掘特征

码报:【j2开奖】未来中国版Kaggle锋芒初显 :CCF大数据与计算智能大赛完美收官

  CCF决赛专家评审组 最终成绩复核现场

  在数据挖掘领域有这么一句话广泛流传:“数据和特征工程(Feature Engineering)决定了机器学习的上限,而模型和算法只是逼近这个上限而已”。所谓特征工程,就是最大限度地从原始数据中提取特征以供算法和模型使用。这类似斯坦福大学教授保罗·瓦茨拉维克在《改变》一书中提出的“第一序改变”与“第二序改变”的关系。比如开车的时候,不管你踩多大的油门都是“第一序改变”,只能无限接近档位限定的速度,只有换档才是“第二序改变”。

  因此,基于领域知识,针对数据本身的深度分析是大赛致胜的关键。各参赛队伍在数据清洗、压缩以及特征提取方面下足了功夫,如分对象抽取的用户、商户、优惠券、Label窗等特征,开奖,以及分层次抽取的全局特征、局部特征、元特征等。以“fgo非洲人”战队为例,其通过对“Human or Robot?”赛题的1.5亿条数据进行特征分析,将数据量压缩至500万条,只有原来的三十分之一,极大提升了后续模型训练的时间,取得了“第二序改变”的优势,最终获得CCF最佳算法能力奖,及相应赛题一等奖。

  用模型的暖阳唤醒黑暗中沉睡的数据

  

码报:【j2开奖】未来中国版Kaggle锋芒初显 :CCF大数据与计算智能大赛完美收官

  “Fgo 非洲人”队在做决赛答辩

  各战队在特征工程的基础上,也创新了多个算法模型。除了熟练运用XGBoost、随机森林(RandomFore)、卷积神经网络(CNN)、循环神经网络(RNN)等常用数据挖掘模型,参赛队伍还对已有模型进行了优化和创新,如针对小目标检测的R-FCN算法、多任务学习框架的精细化人体属性识别算法。另有战队提出的多通道多窗口CNNs模型,只需54秒即可完成2w数据量的训练。“401数据挖掘施工队”结合地理数据的经验,针对“基于多源数据的青藏高原湖泊面积预测”赛题,引入了数量平衡方程、彭曼蒸发公式等领域模型,利用时空关系构建的湖泊预测模型,实现了很好的效果。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容