O Proxecto Nós, impulsado pola Universidade de Santiago de Compostela (USC) e a Xunta de Galiza, e desde o 2023 financiado a través dos fondos PERTE-Next Generation, está a levar a cabo unha recollida de datos de voz en galego a través da plataforma Common Voice. O propósito é dotármonos de recursos de tecnoloxía da fala en galego para garantir a comunicación con máquinas ou con outras persoas a través de máquinas, algo especialmente na era da Intelixencia Artificial (IA).
Até o de agora, o proxecto conseguiu recoller arredor de 300 horas de voces en galego, situando á nosa lingua entre as dez máis activas en Common Voice. Con todo, o obxectivo final é acadar máis de 1000 horas de gravacións, o que esixe unha participación constante por parte do alumnado, no canto de achegas puntuais.
Co obxectivo de incentivar esta colaboración, a Universidade de Santiago recompensará ao seu estudantado con créditos de libre configuración. As persoas participantes poderán obter ese crédito tras completar 25 horas de actividade, que inclúe tanto a gravación de frases como a validación das gravacións de outras persoas.
Como participar na iniciativa
A participación está aberta a calquera persoa faltante de galego que teña acceso a un dispositivo conectado á Internet, como un ordenador, tablet ou teléfono móbil. Os pasos principais son, como xa se avanzou, ler e gravar unha serie de textos proporcionados pola plataforma; e escoitar as gravacións de outras usuarias e validar a súa calidade e exactitude.
O proceso rexístrase no perfil de usuario en Common Voice e, no caso do estudantado da USC que queira solicitar a convalidación, será preciso capturar unha pantalla coa clasificación que amose un número de fragmentos gravados e validados para a xustificación do crédito.
Proxecto Nós: un proxecto clave para o futuro do galego
A diversidade de voces e acentos é fundamental para que os sistemas de intelixencia artificial poidan representar con fidelidade a realidade sociolingüística de Galiza. Con este proxecto búscase que o galego teña unha presenza relevante e competitiva no ámbito tecnolóxico, situándoo á mesma altura que outras grandes linguas do mundo.
A implicación da comunidade galega é esencial para acadar o obxectivo e asegurar que o galego siga a ser unha lingua viva no contexto dixital global.