去大赛网 | 网站公告 | 进入论坛 |
您当前的位置:首页 > 专业 > 编程 > 大数据

2014年阿里巴巴大数据竞赛

时间:2014-03-26 16:31:31  来源:去大赛网工作组  作者:去大赛网工作组

2014年阿里巴巴大数据竞赛
(“去大赛网”整理:www.godasai.com)
报名
(开始时间)
报名
(结束时间)
推荐专业
参赛对象
参赛方法
2014年3月10日
在2014年4月20日前
不限
全日制高校(研究院所)本科、硕士、博士均可参赛
官网报名,网址见下文
参赛形式
地区
报名费
主办单位
举办次数
个人/小队(不超3人可跨院跨校)
全国
阿里巴巴集团
不详
初赛/预赛时间
决赛时间
获奖名单
获奖证书
竞赛类别
Season 1:2014年3月10日至4月20日;
Season 2:2014年4月25日至7月30日;
Season 3(即线上赛,实战2014年双11):
具体时间不详
具体时间不详
不详
大赛官方网址
特别激励
Season1: 不设奖项,但是会从参赛队伍中选择较优者进入Season 2阶段比赛
Season2: 阶段奖项:
一等奖:1支队伍,奖金贰拾万
二等奖:1支队伍,奖金伍万
三等奖:1支队伍,奖金贰万
Season3: Season2阶段的优胜者将在天猫实际开发2014年双11线上算法,并有机会赢取100万大奖
(上述奖项以决赛答辩成绩的最终名次决定)

season2其它奖项:
月星星奖:每期月度榜单排名Top10的参赛队成员都将获得搭载云OS的手机一部;
优胜奖:决赛全国赛排名Top50的参赛队成员直接进入阿里巴巴校园招聘绿色通道(即招聘流程省略简历筛选及笔试筛选阶段,直接进入面试阶段) ,在校期间均有效;并将获得阿里纪念T恤和大赛获奖证书 ;
总决赛Top10的主要参赛队成员可直接入围“阿里星”计划,参赛队的指导老师(如有)将享受天池数据的最高使用权限1年;

 

 

2014年阿里巴巴大数据竞赛
一、大赛简介
阿里巴巴大数据竞赛是阿里巴巴集团主办,在阿里巴巴大数据科研平台——“天池”上开展的,基于天猫海量真实用户的访问数据的推荐算法大赛。
本次比赛的目的是让广大的高校同学在大数据时代的背景下,有机会学习和利用阿里巴巴的大数据和云计算平台,尝试解决真实的业务与社会问题。
 
二、竞赛流程
整个比赛分为三季(season):
Season1:2014年3月10日至4月20日,参赛者可以下载少量天猫的真实行为数据,并在本地调试算法,提交结果。
Season2:2014年4月25日至7月30日,参赛者须使用“天池”平台(阿里巴巴自主研发的分布式计算平台),访问海量的天猫数据,并利用Map&Reduce、SQL及各种平台集成的机器学习算法包调试模型、提交结果。
Season3(即线上赛,实战双11):2014年10月至11月,Season2的top选手可以访问天猫,参与2014年双11的真实算法设计,并有机会获取百万大奖。
 
三、报名规则
参赛对象
全日制高校(研究院所)本科、硕士、博士均可参赛
 
组队规则
参赛队伍可以是单人组队,或者自由组合,但是最多不超过三人(可以跨学院跨学校)。如果是多人团队,则需指定一名队长,负责沟通事宜。另外每个队伍可以配备指导老师一名。
 
注:
1.每人只能参加一支队伍;
2.保证参赛队员报名信息准确有效,否则会被取消参赛资格及激励;
3.进入season2后,不允许变更队伍成员;
4.报名时间:只要在4月20日0:00(season1截止)之前报名即可。鼓励大家早点报名,可以早点接触到数据,以确保参赛时间充足;
5.报名方式:官网注册账号后报名即可;
(“去大赛网”注:官方网址http://102.alibaba.com/competition/addDiscovery/index.htm
 
四、赛制安排
 
环节
时间
规则
Season 1
3月10日—4月20日
1.利用可下载的少量天猫数据,建模与提交结果。
2.每周提供1次算法提交机会(提交截止时间为每周日凌晨2点),隔天公布排行榜,
按照F1分从高到低排序;
3.2014年4月20日选出第一赛季最好成绩排名在前500名的队伍进入第二赛季;
Season 2
4月25日-7月30日
1. 参赛者需登录阿里巴巴天池平台,访问海量天猫数据。利用天池平台的集成工具与算法,建模与提交结果。
2. 评审规则:每天提供1次算法提交机会,每天更新排行榜,按照F1分从高到低排序。(排行榜将选择选手在本阶段的历史最优成绩进行排名展示,选手每日的成绩请至个人中心查询)
3. 2014年7月24日将重新抽样一批相同量级的数据(保证抽样方式一致),7.30零点截止算法的提交,并取7.24-7.30最优成绩前Top10的参赛队进入最终评审。
4. Top10的参赛队,需要准备评审材料,在8月20日来杭州参加答辩,根据参赛队的算法原理、season2的成绩,决出最终的冠亚季军。
Season 3
10-11月 (线上赛)
邀请决赛成绩TOP3的参赛队参与天猫线上算法的设计,并在双11当天检验效果,根据线上AB Test 结果,决定最终成绩,赢取100w大奖。整个过程将由媒体全程跟踪和监督。
 
 
五、奖项设置
Season1不设奖项,但是会从参赛队伍中选择较优者进入Season2阶段比赛
 
Season2阶段奖项:
一等奖:1支队伍,奖金贰拾万
二等奖:1支队伍,奖金伍万
三等奖:1支队伍,奖金贰万
(上述奖项以决赛答辩成绩的最终名次决定)
月星星奖:每期月度榜单排名Top10的参赛队成员都将获得搭载云OS的手机一部(具体手机型号在公布榜单时公布)
优胜奖:决赛全国赛排名Top50的参赛队成员直接进入阿里巴巴校园招聘绿色通道(即招聘流程省略简历筛选及笔试筛选阶段,直接进入面试阶段),在校期间均有效;并将获得阿里纪念T恤和大赛获奖证书
总决赛Top10的主要参赛队成员可直接入围“阿里星”计划,参赛队的指导老师(如有)将享受天池数据的最高使用权限1年
 
Season3线上阶段奖项:
Season2阶段的优胜者,将会受邀访问天猫,在天猫实际开发2014年双11线上算法,并有机会赢取100万大奖(组委会将在Season2结束后公布细则)
 
六、主办方
阿里巴巴集团
 
七、合作方
中国中文信息学会、InfoQ技术媒体、SF社区
 
 
附:赛题介绍
本赛题适用于season1 和season 2的比赛,season 3 为线上赛(season 2 赛后公布题目)。
在天猫,每天都会有数千万的用户通过品牌发现自己喜欢的商品,品牌是联接消费者与商品最重要的纽带。本届赛题的任务就是根据用户4个月在天猫的行为日志,建立用户的品牌偏好,并预测他们在将来一个月内对品牌下商品的购买行为。
我们会开放如下数据类型:
字 段
字段说明
提取说明
user_id
用户标记
抽样&字段加密
Time
行为时间
精度到天级别&隐藏年份
action_type
用户对品牌的行为类型
包括点击、购买、加入购物车、收藏4种行为
(点击:0 购买:1 收藏:2 购物车:3)
brand_id
品牌数字ID
抽样&字段加密
 
用户对任意商品的行为都会映射为一行数据。其中所有商品ID都已汇总为商品对应的品牌ID。用户和品牌都分别做了一定程度的数据抽样,且数字ID都做了加密。所有行为的时间都精确到天级别(隐藏年份)。
 
评估指标不同赛季使用数据说明(详略,见官网)
来顶一下
返回首页
返回首页
上一篇:返回列表    下一篇:2014年(2014-2015)第一届全国高校云计算应用创新大赛
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表
推荐资讯
2017年第八届蓝桥杯全国软件和信息技术专业人才大赛
2017年第八届蓝桥杯全
2017年第六届ASC世界大学生超级计算机竞赛
2017年第六届ASC世界大
2017年第八届CDN中国汽车设计大赛
2017年第八届CDN中国汽
2016年首届GIX创新大赛
2016年首届GIX创新大赛
相关文章
栏目更新
栏目热门
贴心广告