04/08/2020
4 Août , 2020 read
Découvrez notre article de conférence Artificial Neural Networks for Text-to-SQL task: state of the art – Conférence internationale sur les technologies intelligentes de l’information et de la communication – Lecture Notes in Electrical Engineering, publié dans Springer Link. Cette étude est en anglais.
Merci à l’équipe de recherche de Novelis pour son savoir-faire et son expertise.
Les bases de données stockent une quantité importante de données provenant du monde entier. Toutefois, pour accéder à ces données, les utilisateurs doivent comprendre un langage d’interrogation tel que SQL. Afin de faciliter cette tâche et de rendre l’interaction avec les bases de données possible pour le monde entier, des recherches sont récemment apparues pour approcher des systèmes qui comprennent les questions en langage naturel et les convertissent automatiquement en requêtes SQL. L’objectif de cet article est de fournir l’état de l’art de la tâche text-to-SQL dans lequel nous présentons les principaux modèles et solutions existants basés sur les réseaux de neurones artificiels (ANN), précisément sur le Deep Learning (DL) et le traitement du langage naturel (NLP). Nous précisons également les paramètres expérimentaux de chaque approche, leurs limites ainsi qu’une comparaison des meilleures existantes.
“Text-to-SQL task is one of the most important subtask of semantic parsing in natural language processing (NLP). It maps natural language sentences to corresponding SQL queries. In recent years, some state-of-the-art methods with Seq2Seq encoder-decoder architectures (Ilya Sutskever, Oriol Vinyals, Quoc V. Le 2014) [1] are able to obtain more than 80% exact matching accuracy on some complex text-to-SQL benchmarks such as Atis (Price, 1990; Dahl and al., 1994) [2], GeoQuery (Zelle and Mooney, 1996) [3], Restaurants (Tang and Mooney, 2000; Popescu and al., 2003) [4], Scholar (Iyer and al., 2017) [5], Academic (Li and Jagadish, 2014) [6], Yelp (Yaghmazadeh and al., 2017) [7] and WikiSQL (Zhong and al., 2017) [8].These models seem to have already solved most problems in this area. However, as (Finegan-Dollak et al., 2018) [9] show, because of the problematic task definition in the traditional datasets, most of these mod- els just learn to match semantic parsing results, rather than truly learn to understand the meanings of inputs and generalize to new programs and databases, which led to low precisions on more generic dataset as the case of Spider (YU, Tao, ZHANG, Rui, YANG, Kai, and al. 2018) [10].”
Lecture Notes in Electrical Engineering (LNEE, volume 684)
SpringerLink fournit aux chercheurs l’accès à des millions de documents scientifiques provenant de revues, livres, séries, protocoles et ouvrages de référence.