El projecte AINA, la IA i les tecnologies del llenguatge

Auteurs-es

Mots-clés :

IA, tecnologies del llenguatge, català, PLN

Résumé

Una de les àrees més rellevants de la IA és el processament del llenguatge natural (PLN). En aquest àmbit, tot i que actualment la majoria dels grans models de llenguatge ja són multilingües, hi ha una diferència substancial entre les capacitats dels models pel que fa a l’anglès i a la resta de llengües. En aquest sentit, el projecte AINA té per objectiu desenvolupar la infraestructura necessària per què la inclusió del català a les aplicacions d’IA sigui prou atractiva i viable. Aquest article presenta els objectius del projecte i n’explica les característiques generals.

Téléchargements

Les données relatives au téléchargement ne sont pas encore disponibles.

Biographie de l'auteur-e

Marta Villegas Montserrat , Barcelona Supercomputing Center

Marta Villegas fa més de 25 anys que treballa com a investigadora en el camp del processament del llenguatge natural. Actualment és la responsable de la Unitat de Tecnologies de la Llengua al Barcelona Supercomputing Center - Centro Nacional de Supercomputación, on dirigeix els treballs per al desenvolupament de models lingüístics. La Unitat ha compilat recentment el corpus espanyol i català més gran mai creat i ha desenvolupat models de referència transformers que han tingut un gran impacte, tant en el món acadèmic com en la indústria. Coordina el projecte AINA i és responsable de diversos projectes nacionals i europeus.

Références

Mikolov, Tomas; et al. (2013). «Efficient Estimation of Word Representations in Vector Space». arXiv:1301.3781

Pennington et al. (2014). «GloVe: Global Vectors for Word Representation».

Bojanowski et al. (2017). «Enriching Word Vectors with Subword Information»

Devlin J, Chang MW, Lee K, Toutanova K. Bert: Pre-training of deep bidirectional transformers for language understanding. arXiv preprint arXiv:1810.04805. 2018 Oct 11

«Language Models are Few-Shot Learners» https://arxiv.org/abs/2005.14165

Téléchargements

Publié-e

2023-06-29

Comment citer

Villegas Montserrat , M. (2023). El projecte AINA, la IA i les tecnologies del llenguatge. Terminàlia, 1(27). Consulté à l’adresse https://revistes.iec.cat/index.php/Terminalia/article/view/150579

Numéro

Rubrique

Dossier: La terminologie de la Intelligence Artificielle