“IJCAI 2018阿里妈妈国际广告算法大赛”在近日公布了新进展,有500个团队从大赛5200多支参赛队伍中脱颖而出,进入复赛阶段。
根据阿里云天池平台的官方统计,这是一场选手地域范围最广的比赛,参赛水平也达到了世界级,初赛时即吸引了6大洲、50个国家和地区的选手参赛,进入复赛的队伍不乏全球一流院校及企业的人工智能研究者的身影。
Cubix 公司的研究员和数据科学家Rafi Ullah ,他所带领的队伍是企业中的研究机构,他主张要让关于人工智能的学术研究应用于实际生活中的真实场景、解决世界级的通用型问题。他对于阿里妈妈及阿里云天池平台有着持续关注,此次大赛的赛题和他的学术主张有着高度吻合。
作为阿里经济体的数字营销中台,阿里妈妈在过去几年采用深度学习、在线学习、强化学习等人工智能技术来高效准确地预测用户的购买意向。此次比赛的赛题,就是以阿里电商广告为研究对象,参赛选手通过人工智能技术构建预测模型预估用户的购买意向。阿里妈妈为此提供了脱敏后的阿里海量真实交易数据,选手们的挑战正是发生在真实的广告场景和数据规模中。
这样的赛题以及IJCAI这个国际顶级赛事的光环——International Joint Conference on Artificial Intelligence,是人工智能领域最好的学术会议之一——让即使是对转化率预测领域接触不多的学者,也对比赛流露出了极大的兴趣。
西澳大学马歇尔中心的数据科学家王文超正是被这样的条件吸引,和同事一起报名了比赛;埃塞俄比亚的Nathaniel Tesfaye M,在浏览Facebook时发现了比赛信息,惊叹“世界上还有这样的比赛”,报名并成功进入复赛。
“以前从未接触过阿里妈妈的数据或者技术,现在阿里妈妈提供了富有挑战的赛题和优质的脱敏数据,与我曾经做过的任何一个比赛都有很大的不同,于是我也尝试了许多新的方法,对广告场景以及转化率预测有了一些理解。”来自中科院计算所智能信息处理重点实验室的潘斐阳这样认为,这样的声音也代表了这些来自学术界参赛者的想法。
潘斐阳目前是一名博二学生,研究专注于强化学习 (ReinforcementLearning) 以及它的各种应用,他所在的队伍持续蝉联榜单TOP1。他对复赛充满期待,“对我来说,初赛的数据量比较小,当我希望尝试流行的深度学习模型时,会发现由于数据量的限制,深度学习难以达到令人满意的效果,这可能是我现在的一个遗憾,因为我认为利用深度学习我们能有多得多的创新。”
的确,复赛将为选手们提供一个更广阔的天地,复赛的数据规模是初赛的20倍,同时,与初赛时训练和测试数据的分布较为一致相比,复赛评测数据采用了一个特殊活动日期的数据,而训练数据则是平时的数据+部分特殊日期的数据,数据分布上的差异较大,所以整个比赛的难度也有所增加。
对于复赛,大赛评委也给出了几点建议:1)在特征设计方面,模型的选择上可以根据数据规模的扩大来做一些优化和调整;2)特殊日期数据的设定,需要选手多去关注数据特点,采用技术手段去处理数据分布变化的问题。
复赛将持续到5月中旬,经过答辩后,将有5支队伍亮相位于斯德哥尔摩的IJCAI 2018现场,在人工智能的顶级盛会上,展示其对转化率预估的理解和推动。想看更多淘宝资讯,就在九头蛇淘宝论坛网。
留言与评论(共有 条评论) |