Resiliència digital: aprofitar el poder del col·lectiu per preservar la llengua. Una història d’èxit per al català Autors/ores Ona de Gibert Bonet Universitat d’Hèlsinki https://orcid.org/0000-0002-7163-4807 DOI: 10.2436/20.2503.01.191 Paraules clau: intel·ligència artificial, català, preservació de la llengua, codi obert Resum El creixement generalitzat de la intel·ligència artificial (IA) ha fet que les tecnologies de la llengua siguin més accessibles que mai i ha portat aquesta tecnologia a la nostra vida diària. Tanmateix, el desenvolupament accelerat de la tecnologia lingüística comporta intrínsecament un biaix cap a una perspectiva anglocèntrica i eurocèntrica, que té com a resultat una representació i un reconeixement limitats de les llengües minoritzades. És ben sabut que la presència d’una llengua en línia en garanteix la supervivència. En aquest article explorem la història d’èxit del català, una llengua minoritzada amb una comunitat activa en línia, que ha establert les bases per al desenvolupament de les tecnologies de la llengua. La història d’èxit de la comunitat catalanoparlant demostra que les comunitats poden tenir un paper important en la supervivència i en l’evolució de les llengües minoritzades en l’era digital. Descàrregues Les dades de descàrrega encara no estan disponibles. Biografia de l'autor/a Ona de Gibert Bonet , Universitat d’Hèlsinki Ona de Gibert és estudiant de doctorat en Traducció Automàtica a la Universitat d’Hèlsinki, on contribueix al desenvolupament de tecnologies del llenguatge per a llengües amb pocs recursos. Graduada en Llengües i Literatures Modernes per la Universitat de Barcelona (2016), va obtenir un màster en Anàlisi i Processament del Llenguatge per la Universitat del País Basc - Euskal Herriko Unibertsitatea (UPV-EHU) (2018). El seu principal camp de treball gira entorn de la traducció automàtica, des de la seva implementació pràctica a l’empresa fins a la recerca de nous mètodes en la seva posició actual. També es dedica a la divulgació i l’activisme científics per a la preservació de les llengües minoritzades en l’era digital. Ha treballat en el projecte AINA, en l’àmbit estatal, i en el projecte Big Science, en l’àmbit internacional. Referències Bali, Kalika; Choudhury, Monojit; Sitaram, Sunaya; Seshadri, Vivek (2019). «ELLORA: Enabling low resource languages with technology». Proceedings of the 1st International Conference on Language Technologies for All, p. 160- 163. Choudhury, Monojit (2008). «Breaking the Zipfian Barrier of NLP». Proceedings of the IJCNLP- 08 Workshop on NLP for Less Privileged Languages. CNRS (2021). Largest trained open-science multilingual language model ever [en línia]. Comunicat de premsa. [Consulta: 29 de març de 2023]. Eberhard, David M.; Simons, Gary F.; Fennig, Charles D. (ed.) (2023). Ethnologue: Languages of the world [en línia]. 26a ed. Dallas, Texas: SIL International. [Consulta: 29 de març de 2023]. Fundació.cat (2022). Estat del català a Internet i les TIC [en línia]. [Consulta: 29 de març de 2023]. Hinojo, Àlex (2020). «Somien els viquipedistes en enciclopèdies elèctriques? Present i futur de la Viquipèdia i el rol de la comunitat catalanoparlant». Revista de Llengua i Dret / Journal of Language and Law [en línia], 73, 133- 145. [Consulta: 29 de març de 2023]. Külebi, Baybars (2021). «El fet diferencial del català: la comunitat de programari lliure i obert». Pensem [en línia] [Consulta: 29 de març de 2023]. Melero, Maite (2021). «La tecnologia obre portes a la diversitat lingüística digital». Pensem [en línia]. [Consulta: 29 de març de 2023]. Melero, Maite; Figueras, Blanca C.; Rodríguez, Mar; Villegas, Marta (2022). «Report on the Catalan language». Language Technology Support of Europe’s Languages in 2020/2021 - European Language Equality Project. Mollberg, David Erik; Jónsson, Ólafur. Helgi; Porsteinsdóttir, Sunneva; Steingrímsson, Steinpór; Magnúsdóttir, Eydis Huld; Guðnason, Jón (2020). «Samrómur: Crowd-sourcing data collection for Icelandic speech recognition». LREC 2020 - 12th International Conference on Language Resources and Evaluation, Conference Proceedings (maig), p. 3463-3467. Muhire, Remy (2020). How Rwanda is making voice tech more open [en línia]. Mozilla Foundation. [Consulta: 29 de març de 2023]. Ní Chasaide, Ailbhe; Ní Chiaráin, Neasa; Berthelsen, Harald; Wendler, Chrisyoph; Murphy, Andrew; Barnes, Emily; Gobl, Christer (2019). «Can we defuse the digital timebomb? Linguistics, speech technology and the Irish language community». Proceedings of the 1st International Conference on Language Technologies for All [en línia], p. 177-181. [Consulta: 29 de març de 2023]. Plataforma per la Llengua (2018). InformeCAT 2018: 50 dades sobre la llengua catalana [en línia]. [Consulta: 29 de març de 2023]. — (2020). InformeCAT 2020: 50 dades sobre la llengua catalana [en línia]. [Consulta: 29 de març de 2023]. Prys, Delith; Jones, Dewi B.; Prys, Gruffud (2019). «Planning for language technology development and language revitalization in Wales». Proceedings of the 1st International Conference on Language Technologies for All, p. 367-370. Riera Irigoyen, Marc; Ivers Ribes, Xavier; Orga Esteve, Pere; Montané Camacho, Joan, Mas Hernández, Jordi; Vicedo Cremades, Artur (2020). «Softcatalà: nous reptes per garantir la vitalitat del català a les tecnologies». Revista de Llengua i Dret / Journal of Language and Law [en línia], 73, p. 146-153. [Consulta: 29 de març de 2023]. Scao, Teven Le; Fan, Angela; Akiki, Christopher; Pavlick, Ellie; Ilić, Suzana; Hesslow, Daniel; […];Wolf, Thomas. (2022). «Bloom: A 176b-parameter open-access multilingual language model» [en línia]. Uszkoreit, Hans; Rehm, Georg (2012). META-NET White Paper Series: Press Release [en línia]. Woodbury, Anthony C. (2019). What is an endangered language? Washington: Linguistic Society of America. Descàrregues PDF PDF (English) Publicat 2023-06-29 Com citar de Gibert Bonet , O. (2023). Resiliència digital: aprofitar el poder del col·lectiu per preservar la llengua. Una història d’èxit per al català. Terminàlia, 1(27). Retrieved from https://revistes.iec.cat/index.php/Terminalia/article/view/150580 Més formats de citació ACM ACS APA ABNT Chicago Harvard IEEE MLA Turabian Vancouver Descarregar citació Endnote/Zotero/Mendeley (RIS) BibTeX Número Núm. 27: Juny 2023 Secció Dossier: La terminologia de la intel·ligència artificial Llicència Els autors registrats a la plataforma OJS han de llegir els termes de cessió de drets d'autor i emplenar la casella d'acceptació corresponent.La propietat intel·lectual dels articles és dels respectius autors.Els autors en el moment de lliurar els articles a Terminàlia per a sol·licitar-ne la publicació accepten els termes següents:Els autors cedeixen a la SCATERM els drets de reproducció, comunicació pública i distribució dels articles presentats per a ser publicats a Terminàlia.Els autors responen davant la SCATERM de l’autoria i l’originalitat dels articles presentats.És responsabilitat dels autors l’obtenció dels permisos per a la reproducció de tot el material gràfic inclòs en els articles.La SCATERM està exempta de tota responsabilitat derivada de l’eventual vulneració de drets de propietat intel·lectual per part dels autors.Els continguts publicats a la revista estan subjectes —llevat que s’indiqui el contrari en el text o en el material gràfic— a una llicència Reconeixement - No comercial - Sense obres derivades 3.0 Espanya (by-nc-nd) de Creative Commons, el text complet de la qual es pot consultar a http://creativecommons.org/licenses/by-nc-nd/3.0/es/deed.ca. Així doncs, s’autoritza el públic en general a reproduir, distribuir i comunicar l’obra sempre que se’n reconegui l’autoria i l’entitat que la publica i no se’n faci un ús comercial ni cap obra derivada.Terminàlia no es fa responsable de les idees i opinions exposades pels autors dels articles publicats.