| 
             2014年阿里巴巴大数据竞赛2Pa去大赛网 
            (“去大赛网”整理:www.godasai.com) 
             | 
         
        
            | 
             报名2Pa去大赛网 
            (开始时间) 
             | 
            
             报名2Pa去大赛网 
            (结束时间) 
             | 
            
             推荐专业 
             | 
            
             参赛对象 
             | 
            
             参赛方法 
             | 
         
        
            | 
             2014年3月10日 
             | 
            
             在2014年4月20日前 
             | 
            
             不限 
             | 
            
             全日制高校(研究院所)本科、硕士、博士均可参赛 
             | 
            
             官网报名,网址见下文 
             | 
         
        
            | 
             参赛形式 
             | 
            
             地区 
             | 
            
             报名费 
             | 
            
             主办单位 
             | 
            
             举办次数 
             | 
         
        
            | 
             个人/小队(不超3人可跨院跨校) 
             | 
            
             全国 
             | 
            
             无 
             | 
            
             阿里巴巴集团 
             | 
            
             不详 
             | 
         
        
            | 
             初赛/预赛时间 
             | 
            
             决赛时间 
             | 
            
             获奖名单 
             | 
            
             获奖证书 
             | 
            
             竞赛类别 
             | 
         
        
            | 
             Season 1:2014年3月10日至4月20日; 
             | 
            
             Season 2:2014年4月25日至7月30日;2Pa去大赛网 
            Season 3(即线上赛,实战2014年双11): 
             | 
            
             具体时间不详 
             | 
            
             具体时间不详 
             | 
            
             不详 
             | 
         
        
            | 
             大赛官方网址 
             | 
            
             特别激励 
             | 
         
        
            | 
            
             | 
            
             Season1: 不设奖项,但是会从参赛队伍中选择较优者进入Season 2阶段比赛 2Pa去大赛网 
            Season2: 阶段奖项:2Pa去大赛网 
            一等奖:1支队伍,奖金贰拾万 2Pa去大赛网 
            二等奖:1支队伍,奖金伍万 2Pa去大赛网 
            三等奖:1支队伍,奖金贰万2Pa去大赛网 
            Season3: Season2阶段的优胜者将在天猫实际开发2014年双11线上算法,并有机会赢取100万大奖2Pa去大赛网 
            (上述奖项以决赛答辩成绩的最终名次决定)2Pa去大赛网 
            2Pa去大赛网 
            season2其它奖项:2Pa去大赛网 
            月星星奖:每期月度榜单排名Top10的参赛队成员都将获得搭载云OS的手机一部;2Pa去大赛网 
            优胜奖:决赛全国赛排名Top50的参赛队成员直接进入阿里巴巴校园招聘绿色通道(即招聘流程省略简历筛选及笔试筛选阶段,直接进入面试阶段) ,在校期间均有效;并将获得阿里纪念T恤和大赛获奖证书 ;2Pa去大赛网 
            总决赛Top10的主要参赛队成员可直接入围“阿里星”计划,参赛队的指导老师(如有)将享受天池数据的最高使用权限1年; 
             | 
         
    
 
2Pa去大赛网
 2Pa去大赛网 
 2Pa去大赛网 
2014年阿里巴巴大数据竞赛 
一、大赛简介 
阿里巴巴大数据竞赛是阿里巴巴集团主办,在阿里巴巴大数据科研平台——“天池”上开展的,基于天猫海量真实用户的访问数据的推荐算法大赛。 
本次比赛的目的是让广大的高校同学在大数据时代的背景下,有机会学习和利用阿里巴巴的大数据和云计算平台,尝试解决真实的业务与社会问题。 
  
二、竞赛流程 
整个比赛分为三季(season): 
Season1:2014年3月10日至4月20日,参赛者可以下载少量天猫的真实行为数据,并在本地调试算法,提交结果。 
Season2:2014年4月25日至7月30日,参赛者须使用“天池”平台(阿里巴巴自主研发的分布式计算平台),访问海量的天猫数据,并利用Map&Reduce、SQL及各种平台集成的机器学习算法包调试模型、提交结果。 
Season3(即线上赛,实战双11):2014年10月至11月,Season2的top选手可以访问天猫,参与2014年双11的真实算法设计,并有机会获取百万大奖。 
  
三、报名规则 
参赛对象 
全日制高校(研究院所)本科、硕士、博士均可参赛 
  
组队规则 
参赛队伍可以是单人组队,或者自由组合,但是最多不超过三人(可以跨学院跨学校)。如果是多人团队,则需指定一名队长,负责沟通事宜。另外每个队伍可以配备指导老师一名。 
  
注: 
1.每人只能参加一支队伍; 
2.保证参赛队员报名信息准确有效,否则会被取消参赛资格及激励; 
3.进入season2后,不允许变更队伍成员; 
4.报名时间:只要在4月20日0:00(season1截止)之前报名即可。鼓励大家早点报名,可以早点接触到数据,以确保参赛时间充足; 
5.报名方式:官网注册账号后报名即可; 
  
四、赛制安排 
  
    
        
            | 
             环节 
             | 
            
             时间 
             | 
            
             规则 
             | 
         
        
            | 
             Season 1 
             | 
            
             3月10日—4月20日 
             | 
            
             1.利用可下载的少量天猫数据,建模与提交结果。 2Pa去大赛网 
            2.每周提供1次算法提交机会(提交截止时间为每周日凌晨2点),隔天公布排行榜, 2Pa去大赛网 
            按照F1分从高到低排序; 2Pa去大赛网 
            3.2014年4月20日选出第一赛季最好成绩排名在前500名的队伍进入第二赛季; 
             | 
         
        
            | 
             Season 2 
             | 
            
             4月25日-7月30日 
             | 
            
             1. 参赛者需登录阿里巴巴天池平台,访问海量天猫数据。利用天池平台的集成工具与算法,建模与提交结果。 2Pa去大赛网 
            2. 评审规则:每天提供1次算法提交机会,每天更新排行榜,按照F1分从高到低排序。(排行榜将选择选手在本阶段的历史最优成绩进行排名展示,选手每日的成绩请至个人中心查询) 2Pa去大赛网 
            3. 2014年7月24日将重新抽样一批相同量级的数据(保证抽样方式一致),7.30零点截止算法的提交,并取7.24-7.30最优成绩前Top10的参赛队进入最终评审。 2Pa去大赛网 
            4. Top10的参赛队,需要准备评审材料,在8月20日来杭州参加答辩,根据参赛队的算法原理、season2的成绩,决出最终的冠亚季军。 
             | 
         
        
            | 
             Season 3 
             | 
            
             10-11月 (线上赛) 
             | 
            
             邀请决赛成绩TOP3的参赛队参与天猫线上算法的设计,并在双11当天检验效果,根据线上AB Test 结果,决定最终成绩,赢取100w大奖。整个过程将由媒体全程跟踪和监督。 
             | 
         
    
 
 
  
  
五、奖项设置 
Season1不设奖项,但是会从参赛队伍中选择较优者进入Season2阶段比赛 
  
Season2阶段奖项: 
一等奖:1支队伍,奖金贰拾万 
二等奖:1支队伍,奖金伍万 
三等奖:1支队伍,奖金贰万 
(上述奖项以决赛答辩成绩的最终名次决定) 
月星星奖:每期月度榜单排名Top10的参赛队成员都将获得搭载云OS的手机一部(具体手机型号在公布榜单时公布) 
优胜奖:决赛全国赛排名Top50的参赛队成员直接进入阿里巴巴校园招聘绿色通道(即招聘流程省略简历筛选及笔试筛选阶段,直接进入面试阶段),在校期间均有效;并将获得阿里纪念T恤和大赛获奖证书 
总决赛Top10的主要参赛队成员可直接入围“阿里星”计划,参赛队的指导老师(如有)将享受天池数据的最高使用权限1年 
  
Season3线上阶段奖项: 
Season2阶段的优胜者,将会受邀访问天猫,在天猫实际开发2014年双11线上算法,并有机会赢取100万大奖(组委会将在Season2结束后公布细则) 
  
六、主办方 
阿里巴巴集团 
  
七、合作方 
中国中文信息学会、InfoQ技术媒体、SF社区 
  
  
附:赛题介绍 
本赛题适用于season1 和season 2的比赛,season 3 为线上赛(season 2 赛后公布题目)。  
在天猫,每天都会有数千万的用户通过品牌发现自己喜欢的商品,品牌是联接消费者与商品最重要的纽带。本届赛题的任务就是根据用户4个月在天猫的行为日志,建立用户的品牌偏好,并预测他们在将来一个月内对品牌下商品的购买行为。  
我们会开放如下数据类型: 
    
        
            | 
             字 段 
             | 
            
             字段说明 
             | 
            
             提取说明 
             | 
         
        
            | 
             user_id 
             | 
            
             用户标记 
             | 
            
             抽样&字段加密 
             | 
         
        
            | 
             Time 
             | 
            
             行为时间 
             | 
            
             精度到天级别&隐藏年份 
             | 
         
        
            | 
             action_type 
             | 
            
             用户对品牌的行为类型 
             | 
            
             包括点击、购买、加入购物车、收藏4种行为 2Pa去大赛网 
            (点击:0 购买:1 收藏:2 购物车:3) 
             | 
         
        
            | 
             brand_id 
             | 
            
             品牌数字ID 
             | 
            
             抽样&字段加密 
             | 
         
    
 
 
  
用户对任意商品的行为都会映射为一行数据。其中所有商品ID都已汇总为商品对应的品牌ID。用户和品牌都分别做了一定程度的数据抽样,且数字ID都做了加密。所有行为的时间都精确到天级别(隐藏年份)。 
  
评估指标及不同赛季使用数据说明(详略,见官网) 
 |