El projecte AINA, la IA i les tecnologies del llenguatge Autors/ores Marta Villegas Montserrat Barcelona Supercomputing Center https://orcid.org/0000-0003-0711-0029 DOI: 10.2436/20.2503.01.189 Paraules clau: IA, tecnologies del llenguatge, català, PLN Resum Una de les àrees més rellevants de la IA és el processament del llenguatge natural (PLN). En aquest àmbit, tot i que actualment la majoria dels grans models de llenguatge ja són multilingües, hi ha una diferència substancial entre les capacitats dels models pel que fa a l’anglès i a la resta de llengües. En aquest sentit, el projecte AINA té per objectiu desenvolupar la infraestructura necessària per què la inclusió del català a les aplicacions d’IA sigui prou atractiva i viable. Aquest article presenta els objectius del projecte i n’explica les característiques generals. Descàrregues Les dades de descàrrega encara no estan disponibles. Biografia de l'autor/a Marta Villegas Montserrat , Barcelona Supercomputing Center Marta Villegas fa més de 25 anys que treballa com a investigadora en el camp del processament del llenguatge natural. Actualment és la responsable de la Unitat de Tecnologies de la Llengua al Barcelona Supercomputing Center - Centro Nacional de Supercomputación, on dirigeix els treballs per al desenvolupament de models lingüístics. La Unitat ha compilat recentment el corpus espanyol i català més gran mai creat i ha desenvolupat models de referència transformers que han tingut un gran impacte, tant en el món acadèmic com en la indústria. Coordina el projecte AINA i és responsable de diversos projectes nacionals i europeus. Referències Mikolov, Tomas; et al. (2013). «Efficient Estimation of Word Representations in Vector Space». arXiv:1301.3781 Pennington et al. (2014). «GloVe: Global Vectors for Word Representation». Bojanowski et al. (2017). «Enriching Word Vectors with Subword Information» Devlin J, Chang MW, Lee K, Toutanova K. Bert: Pre-training of deep bidirectional transformers for language understanding. arXiv preprint arXiv:1810.04805. 2018 Oct 11 «Language Models are Few-Shot Learners» https://arxiv.org/abs/2005.14165 Descàrregues PDF Publicat 2023-06-29 Com citar Villegas Montserrat , M. (2023). El projecte AINA, la IA i les tecnologies del llenguatge. Terminàlia, 1(27). Retrieved from https://revistes.iec.cat/index.php/Terminalia/article/view/150579 Més formats de citació ACM ACS APA ABNT Chicago Harvard IEEE MLA Turabian Vancouver Descarregar citació Endnote/Zotero/Mendeley (RIS) BibTeX Número Núm. 27: Juny 2023 Secció Dossier: La terminologia de la intel·ligència artificial Llicència Els autors registrats a la plataforma OJS han de llegir els termes de cessió de drets d'autor i emplenar la casella d'acceptació corresponent.La propietat intel·lectual dels articles és dels respectius autors.Els autors en el moment de lliurar els articles a Terminàlia per a sol·licitar-ne la publicació accepten els termes següents:Els autors cedeixen a la SCATERM els drets de reproducció, comunicació pública i distribució dels articles presentats per a ser publicats a Terminàlia.Els autors responen davant la SCATERM de l’autoria i l’originalitat dels articles presentats.És responsabilitat dels autors l’obtenció dels permisos per a la reproducció de tot el material gràfic inclòs en els articles.La SCATERM està exempta de tota responsabilitat derivada de l’eventual vulneració de drets de propietat intel·lectual per part dels autors.Els continguts publicats a la revista estan subjectes —llevat que s’indiqui el contrari en el text o en el material gràfic— a una llicència Reconeixement - No comercial - Sense obres derivades 3.0 Espanya (by-nc-nd) de Creative Commons, el text complet de la qual es pot consultar a http://creativecommons.org/licenses/by-nc-nd/3.0/es/deed.ca. Així doncs, s’autoritza el públic en general a reproduir, distribuir i comunicar l’obra sempre que se’n reconegui l’autoria i l’entitat que la publica i no se’n faci un ús comercial ni cap obra derivada.Terminàlia no es fa responsable de les idees i opinions exposades pels autors dels articles publicats.