Predicció de l’ús del català mitjançant la classificació supervisada Autores/as Francisco Grimaldo Universitat de València Emilia López-Iñesta Universitat de València. Departament d’Informàtica Manel Perucho Universitat de València. Departament d’Astronomia i Astrofísica Palabras clave: ús lingüístic, predicció, intel·ligència artificial, aprenentatge automàtic, classificació supervisada. Resumen Un dels principals reptes que ha tingut i té la sociologia del llenguatge és esbrinar quines són les variables que influeixen en els usos lingüístics. En la recerca que presentem ens valem dels mètodes d’una àrea de la intel·ligència artificial, l’aprenentatge automàtic (machine learning), que estudia la implementació de mètodes computacionals que permeten induir models de coneixement a partir d’informació que prové de dades d’exemple disponibles, per a escatir si algun d’aquests millora la predicció del grau d’utilització de la llengua catalana aconseguida fins ara. Hi hem fet servir tres mètodes de classificació supervisada: Naive Bayes, arbres de decisió i màquines de vectors de suport. Per a complir aquesta comesa calia un corpus empíric que ens permetera tant la comprovació del nivell de predicció d’un model teòric com la seua validesa en diferents contextos sociolingüístics. Les recerques que coneixem que tenen uns percentatges més alts de predicció són les dutes a terme per Querol, que han estat avaluades en tots els territoris on es parla català. La investigació que hem fet amb aquestes dades permet concloure que la classificació supervisada pot servir per a construir models de predicció del grau d’ús del català amb un percentatge d’encert que supera els aconseguits en les investigacions precedents. Amb la qual cosa podem establir quines són les variables més informatives. A més, també ens ajuda a resoldre el problema metodològic de la divisió en grups lingüístics i palesa que l’ús és un sistema continu.Paraules clau: ús lingüístic; predicció; intel·ligència artificial; aprenentatge automàtic; classificació supervisada. Descargas Los datos de descargas todavía no están disponibles. Biografía del autor/a Francisco Grimaldo, Universitat de València Professor del Departament d'InformàticaSubdirector de l'Escola Tècnica d'Enginyeria Descargas PDF (Català) Publicado 2020-07-28 Número Núm. 26 (2016): Les llengües en les tecnologies de la informació i la comunicació Sección Secció miscel·lània