Predicció de l’ús del català mitjançant la classificació supervisada Autors/ores Francisco Grimaldo Universitat de València Emilia López-Iñesta Universitat de València. Departament d’Informàtica Manel Perucho Universitat de València. Departament d’Astronomia i Astrofísica Paraules clau: ús lingüístic, predicció, intel·ligència artificial, aprenentatge automàtic, classificació supervisada. Resum Un dels principals reptes que ha tingut i té la sociologia del llenguatge és esbrinar quines són les variables que influeixen en els usos lingüístics. En la recerca que presentem ens valem dels mètodes d’una àrea de la intel·ligència artificial, l’aprenentatge automàtic (machine learning), que estudia la implementació de mètodes computacionals que permeten induir models de coneixement a partir d’informació que prové de dades d’exemple disponibles, per a escatir si algun d’aquests millora la predicció del grau d’utilització de la llengua catalana aconseguida fins ara. Hi hem fet servir tres mètodes de classificació supervisada: Naive Bayes, arbres de decisió i màquines de vectors de suport. Per a complir aquesta comesa calia un corpus empíric que ens permetera tant la comprovació del nivell de predicció d’un model teòric com la seua validesa en diferents contextos sociolingüístics. Les recerques que coneixem que tenen uns percentatges més alts de predicció són les dutes a terme per Querol, que han estat avaluades en tots els territoris on es parla català. La investigació que hem fet amb aquestes dades permet concloure que la classificació supervisada pot servir per a construir models de predicció del grau d’ús del català amb un percentatge d’encert que supera els aconseguits en les investigacions precedents. Amb la qual cosa podem establir quines són les variables més informatives. A més, també ens ajuda a resoldre el problema metodològic de la divisió en grups lingüístics i palesa que l’ús és un sistema continu.Paraules clau: ús lingüístic; predicció; intel·ligència artificial; aprenentatge automàtic; classificació supervisada. Descàrregues Les dades de descàrrega encara no estan disponibles. Biografia de l'autor/a Francisco Grimaldo, Universitat de València Professor del Departament d'InformàticaSubdirector de l'Escola Tècnica d'Enginyeria Descàrregues PDF Publicat 28-07-2020 Número Núm. 26 (2016): Les llengües en les tecnologies de la informació i la comunicació Secció Secció miscel·lània