Kdenlive, voz a texto

Con el editor de videos kdenlive que ha salido recientemente es posible utilizar el plugin speech to text, voz a texto, está en su página oficial descargable para Linux y otros sistemas operativos, generando en forma practicamente automática y dependiendo de la calidad del audio, casi sin errores los subtítulos del vídeo, algo realmente útil para que nuestros videos sean más accesibles para las personas que tienen por ejemplo dificultades auditivas, y todo esto sin necesidad de estar conectados a internet.

Otra utilidad de los subtítulos que he charlado con colegas es para el caso de estudiantes que necesitan ver su video tutorial en un ambiente con ruido ambiente, los podrán leer, y seguir su lección, o para personas que deban cuidar menores y no puedan usar sus auriculares, o en una Biblioteca, o en el trabajo, hay muchas situaciones en que los subtítulos se vuelven muy necesarios; o para estudiar o practicar otro idioma.

Para usar esta herramienta en Linux, kdenlive pide instalar previamente varias cosas, colocando los siguientes comandos en la terminal:


sudo apt install python3-pip

pip3 install vosk

pip3 install srt

Esta herramienta que además nos permite exportar (importar también )el archivo de subtítulos, en formato srt, la encontramos en la siguiente ruta:

proyecto/subtítulos/exportar archivo de subtítulos

Nota: Recomiendo consultar el siguiente enlace para ver las instrucciones completas para diversos sistemas operativos: https://userbase.kde.org/Kdenlive/Manual/Timeline/Editing/Speech_to_text

Quería además comentar que basado en esta experiencia, para lograr un buen subtitulado, es clave la calidad del audio a subtitular ya que cuanto mejor pronuncien las personas, y hablen en forma pausada , y no haya en lo posible interrupciones (silenciar los mics en las videoconferencias ! ) ; menos se tardará en hacerlo, porque habrá que corregirlo menos.

Una sugerencia para el caso de querer subtitular el audio de una videoconferencia sería que cada participante se grabe su audio, para tenerlos para editar el audio final porque en general ocurrirán pequeños cortes en el vivo o baches largos que serán casi imposibles de recuperar y por ende de subtitular.
Si hay audio en otros idiomas, habrá que bajar el paquete correspondiente a el; y en la timeline seleccionarlo, con la barrita azul, verlo en el video, y elegir el motor de voz a texto que reconozca dicho idioma.

Actualización: en Agosto 2022 han agregado la opción de bajar el modelo grande español de 1.3 GB, el cual es más preciso y demanda más procesador y ram de nuestro equipo.

Vale la pena tomarnos este trabajo, porque los subtitulados automáticos no siempre lo hacen bien.
Podemos descargar e instalar diferentes paquetes de idiomas desde el link que se observa desde la ventana que encontrás en preferencias/configurar Kdenlive/Voz a texto

vemos link de descarga y paquete descargado
Se muestra los archivos del idioma español para el motor voz a texto Vosk
aquí se ve el menú de Subtítulos

Les comparto el enlace a un video subtitulado utilizando las herramientas mencionadas, es una charla sobre accesibilidad web brindada por la Lic. Iris Fernández del grupo Clementina (educación y cultura libre) .

https://fediverse.tv/w/4bab3a3b-3d0c-49be-9614-d08edf217a88

Por último quería mencionar que hay otros softwares libres para editar subtítulos, aegisub, gnome subtitles, etc. o también para descargarlos, si se trata de series etc.