El projecte AINA, la IA i les tecnologies del llenguatge Autores/as Marta Villegas Montserrat Barcelona Supercomputing Center https://orcid.org/0000-0003-0711-0029 DOI: 10.2436/20.2503.01.189 Palabras clave: IA, tecnologies del llenguatge, català, PLN Resumen Una de les àrees més rellevants de la IA és el processament del llenguatge natural (PLN). En aquest àmbit, tot i que actualment la majoria dels grans models de llenguatge ja són multilingües, hi ha una diferència substancial entre les capacitats dels models pel que fa a l’anglès i a la resta de llengües. En aquest sentit, el projecte AINA té per objectiu desenvolupar la infraestructura necessària per què la inclusió del català a les aplicacions d’IA sigui prou atractiva i viable. Aquest article presenta els objectius del projecte i n’explica les característiques generals. Descargas Los datos de descargas todavía no están disponibles. Biografía del autor/a Marta Villegas Montserrat , Barcelona Supercomputing Center Marta Villegas fa més de 25 anys que treballa com a investigadora en el camp del processament del llenguatge natural. Actualment és la responsable de la Unitat de Tecnologies de la Llengua al Barcelona Supercomputing Center - Centro Nacional de Supercomputación, on dirigeix els treballs per al desenvolupament de models lingüístics. La Unitat ha compilat recentment el corpus espanyol i català més gran mai creat i ha desenvolupat models de referència transformers que han tingut un gran impacte, tant en el món acadèmic com en la indústria. Coordina el projecte AINA i és responsable de diversos projectes nacionals i europeus. Citas Mikolov, Tomas; et al. (2013). «Efficient Estimation of Word Representations in Vector Space». arXiv:1301.3781 Pennington et al. (2014). «GloVe: Global Vectors for Word Representation». Bojanowski et al. (2017). «Enriching Word Vectors with Subword Information» Devlin J, Chang MW, Lee K, Toutanova K. Bert: Pre-training of deep bidirectional transformers for language understanding. arXiv preprint arXiv:1810.04805. 2018 Oct 11 «Language Models are Few-Shot Learners» https://arxiv.org/abs/2005.14165 Descargas PDF (Català) Publicado 2023-06-29 Cómo citar Villegas Montserrat , M. (2023). El projecte AINA, la IA i les tecnologies del llenguatge. Terminàlia, 1(27). Recuperado a partir de https://revistes.iec.cat/index.php/Terminalia/article/view/150579 Más formatos de cita ACM ACS APA ABNT Chicago Harvard IEEE MLA Turabian Vancouver Descargar cita Endnote/Zotero/Mendeley (RIS) BibTeX Número Núm. 27: Junio 2023 Sección Dossier: La terminología de la inteligencia artificial Licencia La propiedad intelectual de los artículos es de sus respectivos autores.Los autores en el momento de entregar los artículos a Terminàlia para solicitar su publicación aceptan los siguientes términos:Los autores ceden a la Societat Catalana de Terminologia (SCATERM) los derechos de reproducción, comunicación pública y distribución de los artículos presentados para ser publicados en Terminàlia.Los autores responden ante SCATERM de la autoría y la originalidad de los artículos presentados.Es responsabilidad de los autores la obtención de los permisos para la reproducción de todo el material gráfico incluido en los artículos.SCATERM está exenta de toda responsabilidad derivada de la eventual vulneración de derechos de propiedad intelectual por parte de los autores.Los contenidos publicados en la revista están sujetos —salvo que se indique lo contrario en el texto o en el material gráfico — a una licencia de Reconocimiento - No comercial - Sin obras derivadas 3.0 España (by-nc-nd) de Creative Commons, cuyo texto completo se puede consultar en http://creativecommons.org/licenses/by-nc-nd/3.0/es/deed.es. Así pues, se permite al público en general reproducir, distribuir y comunicar la obra siempre que se reconozca su autoría y la entidad que la ha publicado, y no se haga un uso comercial de la misma ni se genere ninguna obra derivada. Terminàlia no se hace responsable de las ideas ni de las opiniones expuestas por los autores de los artículos publicados.