Predicció de l’ús del català mitjançant la classificació supervisada Autors/ores Francisco Grimaldo Universitat de València Emilia López-Iñesta Universitat de València. Departament d’Informàtica Manel Perucho Universitat de València. Departament d’Astronomia i Astrofísica Paraules clau: ús lingüístic, predicció, intel·ligència artificial, aprenentatge automàtic, classificació supervisada. Resum Un dels principals reptes que ha tingut i té la sociologia del llenguatge és esbrinar quines són les variables que influeixen en els usos lingüístics. En la recerca que presentem ens valem dels mètodes d’una àrea de la intel·ligència artificial, l’aprenentatge automàtic (machine learning), que estudia la implementació de mètodes computacionals que permeten induir models de coneixement a partir d’informació que prové de dades d’exemple disponibles, per a escatir si algun d’aquests millora la predicció del grau d’utilització de la llengua catalana aconseguida fins ara. Hi hem fet servir tres mètodes de classificació supervisada: Naive Bayes, arbres de decisió i màquines de vectors de suport. Per a complir aquesta comesa calia un corpus empíric que ens permetera tant la comprovació del nivell de predicció d’un model teòric com la seua validesa en diferents contextos sociolingüístics. Les recerques que coneixem que tenen uns percentatges més alts de predicció són les dutes a terme per Querol, que han estat avaluades en tots els territoris on es parla català. La investigació que hem fet amb aquestes dades permet concloure que la classificació supervisada pot servir per a construir models de predicció del grau d’ús del català amb un percentatge d’encert que supera els aconseguits en les investigacions precedents. Amb la qual cosa podem establir quines són les variables més informatives. A més, també ens ajuda a resoldre el problema metodològic de la divisió en grups lingüístics i palesa que l’ús és un sistema continu.Paraules clau: ús lingüístic; predicció; intel·ligència artificial; aprenentatge automàtic; classificació supervisada. Biografia de l'autor/a Francisco Grimaldo, Universitat de València Professor del Departament d'InformàticaSubdirector de l'Escola Tècnica d'Enginyeria Descàrregues PDF Publicat 28-07-2020 Número Núm. 26 (2016): Les llengües en les tecnologies de la informació i la comunicació Secció Secció Miscel·lània Llicència La propietat intel·lectual dels articles és dels respectius autors.Els autors en el moment de lliurar els articles a la revista Treballs de Sociolingüística Catalana per a sol·licitar-ne la publicació accepten els termes següents:Els autors cedeixen a la Societat Catalana de Sociolingüística (filial de l’Institut d’Estudis Catalans) els drets de reproducció, comunicació pública i distribució dels articles presentats per a ser publicats a Treballs de Sociolingüística Catalana.Els autors responen davant la Societat Catalana de Sociolingüística de l'autoria i l'originalitat dels articles presentats.És responsabilitat dels autors l’obtenció dels permisos per a la reproducció de tot el material gràfic inclòs en els articles.La Societat Catalana de Sociolingüística està exempta de tota responsabilitat derivada de l’eventual vulneració de drets de propietat intel·lectual per part dels autors.Els continguts publicats a la revista estan subjectes —llevat que s’indiqui el contrari en el text o en el material gràfic— a una llicència Reconeixement - No comercial - Sense obres derivades 3.0 Espanya (by-nc-nd) de Creative Commons, el text complet de la qual es pot consultar a http://creativecommons.org/licenses/by-nc-nd/3.0/es/deed.ca. Així doncs, s’autoritza el públic en general a reproduir, distribuir i comunicar l’obra sempre que se’n reconegui l’autoria i l’entitat que la publica i no se’n faci un ús comercial ni cap obra derivada.Treballs de Sociolingüística Catalana no es fa responsable de les idees i opinions exposades pels autors dels articles publicats.