Predicció de l’ús del català mitjançant la classificació supervisada

Autors/ores

  • Francisco Grimaldo Universitat de València
  • Emilia López-Iñesta Universitat de València. Departament d’Informàtica
  • Manel Perucho Universitat de València. Departament d’Astronomia i Astrofísica

Paraules clau:

ús lingüístic, predicció, intel·ligència artificial, aprenentatge automàtic, classificació supervisada.

Resum

Un dels principals reptes que ha tingut i té la sociologia del llenguatge és esbrinar quines són les variables que influeixen en els usos lingüístics. En la recerca que presentem ens valem dels mètodes d’una àrea de la intel·ligència artificial, l’aprenentatge automàtic (machine learning), que estudia la implementació de mètodes computacionals que permeten induir models de coneixement a partir d’informació que prové de dades d’exemple disponibles, per a escatir si algun d’aquests millora la predicció del grau d’utilització de la llengua catalana aconseguida fins ara. Hi hem fet servir tres mètodes de classificació supervisada: Naive Bayes, arbres de decisió i màquines de vectors de suport. Per a complir aquesta comesa calia un corpus empíric que ens permetera tant la comprovació del nivell de predicció d’un model teòric com la seua validesa en diferents contextos sociolingüístics. Les recerques que coneixem que tenen uns percentatges més alts de predicció són les dutes a terme per Querol, que han estat avaluades en tots els territoris on es parla català. La investigació que hem fet amb aquestes dades permet concloure que la classificació supervisada pot servir per a construir models de predicció del grau d’ús del català amb un percentatge d’encert que supera els aconseguits en les investigacions precedents. Amb la qual cosa podem establir quines són les variables més informatives. A més, també ens ajuda a resoldre el problema metodològic de la divisió en grups lingüístics i palesa que l’ús és un sistema continu.

Paraules clau: ús lingüístic; predicció; intel·ligència artificial; aprenentatge automàtic; classificació supervisada.

Descàrregues

Les dades de descàrrega encara no estan disponibles.

Biografia de l'autor/a

Francisco Grimaldo, Universitat de València

Professor del Departament d'Informàtica

Subdirector de l'Escola Tècnica d'Enginyeria

Descàrregues

Publicat

28-07-2020