您的位置:首页 > 国内新闻

千支队伍挑战中文NL2SQL 院校与企业参赛者各半

时间:2019-08-31


最近,柴一科技主办的首届中国NL2SQL挑战赛初赛已经完成。来自国内外的1457支球队经过一个多月的预赛,决定了前30名的球队。来自国防科技大学,北京交通大学,国霜科技,清华大学,哈尔滨工业大学等大学的30支获奖队伍将进入下一阶段的半决赛挑战赛。

本次比赛也是中国NLP领域首次举办NL2SQL主题竞赛,并发布相关数据集,引起了业界和国内外的广泛关注。自6月24日比赛开始以来,共有1,457支队伍和1,630名选手参加了比赛。参与的大学数量达到170所,其中227支队伍和318名队员提交了他们的成绩。广泛的参与使NL2SQL成为国内NLP技术竞赛中最大的参与者之一。

img_pic_1566372977_0.jpg

挑战中国数据集

值得注意的是,本次竞赛中提出的NL2SQL中文数据集引入了口语表达,组合表内容,命名实体链接以及比英语数据集WikiSQL更复杂的SQL语法的挑战。它更难以接近真实的应用场景,但是通过对玩家的积极和多学科的探索,可以在短期内在英语数据集上获得相当高的分数。

在为期两个月的初步比赛中,球员的计划继续刷新比赛的新记录。

img_pic_1566372977_1.jpg

在比赛开始时,排名中的顶级球员得分约为0.58,超过了比赛提供的基线。随后,通过各种讨论和交流,参与者加深了对数据集的理解,并不断探索更好的解决方案,以提高他们的表现。主力球员的得分迅速突破0.80关口。在8月12日的预赛结束时,游戏列表的总得分达到0.89,接近WikiSQL。

竞赛结果的快速提升充分体现了球员的优秀投资和计划。同时,它也反映出到目前为止积累的许多技术解决方案可以在NL2SQL的新任务中发挥作用。每个人都意识到,只要有足够的数据支持,目前人工智能的方法可以有效地为数据库甚至结构化数据提供自然语言交互。

数千个团队挑战NL2SQL

NL2SQL竞赛的任务创新和应用潜力得到了学术界和工业界的广泛关注。

据了解,在1457个参赛队伍中,机构和企业参与者各占“全国的一半”。其中,学生和研究人员占48%,企业技术人员占52%。学生团队来自北京大学,清华大学,复旦大学,上海交通大学,南京大学,浙江大学,中国科学技术大学,哈尔滨工业大学,西安交通大学等知名院校。

虽然本次比赛的数据内容为中文,但仍然吸引了来自美国,英国,新加坡,日本,澳大利亚,加拿大等地的顶尖大学,包括卡内基梅隆大学,墨尔本大学,新加坡国立大学,南安普顿大学,新南威尔士大学,布里斯托大学,昆士兰大学等。

作为一项新兴的NLP研究任务,NL2SQL对专业难度的玩家提出了很高的要求。据了解,参赛选手中,硕士以上学历占57%,其中,博士学位占6%;而专业分布,计算机科学专业背景球员属于主要竞争对手。

应用潜力吸引知名企业参与

值得注意的是,NL2SQL挑战赛也吸引了众多企业技术人员参与。

来自中国移动,平安集团,搜狗,大陆科技,中兴通讯,Nethostel科技,国霜科技,捷通华盛等众多企业的技术人员也成为团队中的重要力量。

“参与这一挑战的规模远大于预期,显示了NL2SQL在学术和工业应用中的潜力。数据库交互的创新吸引了越来越多的关注。”超逸科技联合创始人兼首席技术官刘云峰博士表示,超毅科技将与更多机构和业务同仁合作,推动中国NLP研究和应用的突破。

据了解,中国NL2SQL挑战赛的恢复将于8月19日至9月9日举行。在半决赛阶段,采用在线运行模式进行评估。测试集不可下载,并且内容对玩家不可见。同时,测试集确保数据分布与初步竞赛的测试集一致,并添加更多未在预赛中出现的表数据。那时,它将对竞争对手的计划构成更大的挑战。第二轮的获胜者将参加10月份的决赛。

  • 友情链接:
  • 曲靖新闻网 版权所有© www.yzdlmy.com 技术支持:曲靖新闻网| 网站地图