阿里云数据库NL2SQL技能获世界威望评测第一名
日前,阿里云数据库参与耶鲁大学Spider数据集评测,以78分的成果排名榜单第一。这一成果证明了阿里云数据库在NL2SQL技能上的世界领先性。据了解,Spider是业界公认的大规划跨领域复杂NL2SQL转化作用的评测榜单。
NL2SQL(Natural Language to SQL)是一项将用户的天然句子转为数据库可执行SQL句子的技能,对改善用户与数据库之间的交互方法有很大含义。Spider数据集是耶鲁大学提出的一个较大规划的NL2SQL数据集,包含了10000多条天然语言问句,内容覆盖了100多个不同的领域,靠近真实场景,难度十分高。
日前,阿里云数据库团队研发的CatSQL技能参与评测,并获得Spider数据集评测第一名的好成果。78分的成果,显著超越第二名0.4分,尤其是模型规划仅为第二名的1/7,且计算速度提高10倍以上。
达摩院智能数据库实验室负责人谭剑介绍:为提高NL2SQL转化作用,现阶段业界的一个趋势是运用越来越大的模型,而在这次测评中,阿里云数据库团队另辟蹊径,采用了小模型,在获得了简直一个数量级的吞吐率提高的同时,还取得了更好的准确率;该方法也开辟了NL2SQL的一个新思路,即把天然语言技能与数据库领域知识紧密结合,从SQL语义的角度提高NL2SQL的准确性,也更加确保了在实践商用场景中的有效性。
谭剑表示,“最新的成果说明,NL2SQL技能现已日臻成熟,在准确性和实用性上逐渐达到了部分复杂场景的商用要求。”
据泄漏,阿里云数据库团队在NL2SQL方向上现已进行了两年多的自研作业,并现已把这些前沿技能在相关数据库产品中落地运用,有效的简化了用户查询数据库的方法。比方,阿里云数据库的一站式数据管理平台DMS上,就采用了自研CatSQL技能,通过天然语言交互的方法帮助客户更高效的进行数据资产管理。
据了解,阿里云自成立以来就十分重视数据库前沿技能研究,并为此成立专门的研究机构——达摩院数据库与存储实验室。曩昔几年,阿里云数据库团队有50多篇论文被世界顶级会议和期刊录入,获得了近千项国内外专利,并完成自研数据库具有存储计算分离、三层解耦、多主架构、HTAP、Serverless、一体化分布式、全加密、智能与自治化等创新才能。
揭露材料显现,阿里云具有国内最丰富的云数据库产品宗族,云数据库市场份额位居国内第一。据世界威望机构Gartner年度全球云数据库法力象限评价陈述,阿里云作为我国唯一的科技公司代表,于2020年和2021年接连两年进入领导者(LEADERS)象限。这标志着我国数据库40年来初次进入全球顶级数据库队伍。
声明:本文内容仅代表作者个人观点,与本站立场无关。如有内容侵犯您的合法权益,请及时与我们联系,我们将第一时间安排处理