Digital Resilience: Harnessing the Power of the Collective for Language Preservation. A Success Story for Catalan Authors Ona de Gibert Bonet Universitat d’Hèlsinki https://orcid.org/0000-0002-7163-4807 DOI: 10.2436/20.2503.01.191 Keywords: artificial intelligence, Catalan, language preservation, open-source Abstract The widespread growth of Artificial Intelligence (AI) has made language technology more accessible than ever before, bringing language technology into our daily lives. Nevertheless, the rapid development of language technology intrinsically carries a bias towards Anglo-centric and Euro-centric perspectives, leading to limited representation and recognition for minoritized languages. It is a fact that the online presence of a language ensures its survival. This article explores the success story of Catalan, a minoritized language with an active online community, which has laid the foundations for language technology development. The Catalan-speaking community’s success story demonstrates how communities can play a significant role in the survival and evolution of minoritized languages in the digital age. Downloads Download data is not yet available. Author Biography Ona de Gibert Bonet , Universitat d’Hèlsinki Ona de Gibert és estudiant de doctorat en Traducció Automàtica a la Universitat d’Hèlsinki, on contribueix al desenvolupament de tecnologies del llenguatge per a llengües amb pocs recursos. Graduada en Llengües i Literatures Modernes per la Universitat de Barcelona (2016), va obtenir un màster en Anàlisi i Processament del Llenguatge per la Universitat del País Basc - Euskal Herriko Unibertsitatea (UPV-EHU) (2018). El seu principal camp de treball gira entorn de la traducció automàtica, des de la seva implementació pràctica a l’empresa fins a la recerca de nous mètodes en la seva posició actual. També es dedica a la divulgació i l’activisme científics per a la preservació de les llengües minoritzades en l’era digital. Ha treballat en el projecte AINA, en l’àmbit estatal, i en el projecte Big Science, en l’àmbit internacional. References Bali, Kalika; Choudhury, Monojit; Sitaram, Sunaya; Seshadri, Vivek (2019). «ELLORA: Enabling low resource languages with technology». Proceedings of the 1st International Conference on Language Technologies for All, p. 160- 163. Choudhury, Monojit (2008). «Breaking the Zipfian Barrier of NLP». Proceedings of the IJCNLP- 08 Workshop on NLP for Less Privileged Languages. CNRS (2021). Largest trained open-science multilingual language model ever [en línia]. Comunicat de premsa. [Consulta: 29 de març de 2023]. Eberhard, David M.; Simons, Gary F.; Fennig, Charles D. (ed.) (2023). Ethnologue: Languages of the world [en línia]. 26a ed. Dallas, Texas: SIL International. [Consulta: 29 de març de 2023]. Fundació.cat (2022). Estat del català a Internet i les TIC [en línia]. [Consulta: 29 de març de 2023]. Hinojo, Àlex (2020). «Somien els viquipedistes en enciclopèdies elèctriques? Present i futur de la Viquipèdia i el rol de la comunitat catalanoparlant». Revista de Llengua i Dret / Journal of Language and Law [en línia], 73, 133- 145. [Consulta: 29 de març de 2023]. Külebi, Baybars (2021). «El fet diferencial del català: la comunitat de programari lliure i obert». Pensem [en línia] [Consulta: 29 de març de 2023]. Melero, Maite (2021). «La tecnologia obre portes a la diversitat lingüística digital». Pensem [en línia]. [Consulta: 29 de març de 2023]. Melero, Maite; Figueras, Blanca C.; Rodríguez, Mar; Villegas, Marta (2022). «Report on the Catalan language». Language Technology Support of Europe’s Languages in 2020/2021 - European Language Equality Project. Mollberg, David Erik; Jónsson, Ólafur. Helgi; Porsteinsdóttir, Sunneva; Steingrímsson, Steinpór; Magnúsdóttir, Eydis Huld; Guðnason, Jón (2020). «Samrómur: Crowd-sourcing data collection for Icelandic speech recognition». LREC 2020 - 12th International Conference on Language Resources and Evaluation, Conference Proceedings (maig), p. 3463-3467. Muhire, Remy (2020). How Rwanda is making voice tech more open [en línia]. Mozilla Foundation. [Consulta: 29 de març de 2023]. Ní Chasaide, Ailbhe; Ní Chiaráin, Neasa; Berthelsen, Harald; Wendler, Chrisyoph; Murphy, Andrew; Barnes, Emily; Gobl, Christer (2019). «Can we defuse the digital timebomb? Linguistics, speech technology and the Irish language community». Proceedings of the 1st International Conference on Language Technologies for All [en línia], p. 177-181. [Consulta: 29 de març de 2023]. Plataforma per la Llengua (2018). InformeCAT 2018: 50 dades sobre la llengua catalana [en línia]. [Consulta: 29 de març de 2023]. — (2020). InformeCAT 2020: 50 dades sobre la llengua catalana [en línia]. [Consulta: 29 de març de 2023]. Prys, Delith; Jones, Dewi B.; Prys, Gruffud (2019). «Planning for language technology development and language revitalization in Wales». Proceedings of the 1st International Conference on Language Technologies for All, p. 367-370. Riera Irigoyen, Marc; Ivers Ribes, Xavier; Orga Esteve, Pere; Montané Camacho, Joan, Mas Hernández, Jordi; Vicedo Cremades, Artur (2020). «Softcatalà: nous reptes per garantir la vitalitat del català a les tecnologies». Revista de Llengua i Dret / Journal of Language and Law [en línia], 73, p. 146-153. [Consulta: 29 de març de 2023]. Scao, Teven Le; Fan, Angela; Akiki, Christopher; Pavlick, Ellie; Ilić, Suzana; Hesslow, Daniel; […];Wolf, Thomas. (2022). «Bloom: A 176b-parameter open-access multilingual language model» [en línia]. Uszkoreit, Hans; Rehm, Georg (2012). META-NET White Paper Series: Press Release [en línia]. Woodbury, Anthony C. (2019). What is an endangered language? Washington: Linguistic Society of America. Downloads PDF (Català) PDF Published 2023-06-29 How to Cite de Gibert Bonet , O. (2023). Digital Resilience: Harnessing the Power of the Collective for Language Preservation. A Success Story for Catalan . Terminàlia, 1(27). Retrieved from https://revistes.iec.cat/index.php/Terminalia/article/view/150580 More Citation Formats ACM ACS APA ABNT Chicago Harvard IEEE MLA Turabian Vancouver Download Citation Endnote/Zotero/Mendeley (RIS) BibTeX Issue No. 27: June 2023 Section Topic: The Terminology of the Artificial Intelligence License Authors registered on the OJS platform must read the copyright assignment terms and fill in the corresponding acceptance box.The intellectual property of articles belongs to the respective authors.On submitting articles for publication to the journal Terminàlia, authors accept the following terms:Authors assign to SCATERM (a subsidiary of Institut d'Estudis Catalans) the rights of reproduction, communication to the public and distribution of the articles submitted for publication to Terminàlia.Authors answer to SCATERM for the authorship and originality of submitted articles.Authors are responsible for obtaining permission for the reproduction of all graphic material included in articles.SCATERM declines all liability for the possible infringement of intellectual property rights by authors.The contents published in the journal, unless otherwise stated in the text or in the graphic material, are subject to a Creative Commons Attribution-NonCommercial-NoDerivs (by-nc-nd) 3.0 Spain licence, the complete text of which may be found at https://creativecommons.org/licenses/by-nc-nd/3.0/es/deed.en. Consequently, the general public is authorised to reproduce, distribute and communicate the work, provided that its authorship and the body publishing it are acknowledged, and that no commercial use and no derivative works are made of it.The journal is not responsible for the ideas and opinions expressed by the authors of the published articles.