Hilo oficial sobre los sintetizadores de voz

4339 messages, 145 pages: 1…; 118 119120 121 122…; 145 ↖ Retour à la liste des sujets

Score: +42

3571. manantial, 03.07.2023 08:09

A mí me encantaría usar una voz humana real como sintetizador, haber que tal

Score: +0

3572. amitabh_bachchan , 03.07.2023 15:00

qué honda con estas cosas. lo abro ahora y el lector se queda sin habla.

Score: +0

3573. rmcpantoja, 03.07.2023 16:34

Bueno, hace unas horas actualizaron el complemento de NVDA mejorando un componente que debería garantizar una velocidad ligeramente más rápida, que está en la carpeta de Drive ya compilado con el último commit. También se puede probar a través de Google Colab. la interfaz es accesible, y la accesibilidad mejorada te guía en el proceso. También está la guía de entrenamiento.

Score: +0

3574. PolloGuerrero, 03.07.2023 17:35

Buenísimo che, muchas gracias por la guía!
Te pregunto, siendo que ya existen modelos como el de Homero, que me encantaría poder usarlo en este sinte, habría que volver a hacer los datasets de 0 y no son compatibles los que ya circulaban por ahí? digo porque el proceso de entrenamiento me suena bastante parecido, y bueno, hicieron tantos datasets para usar en FakeYou que me gustaría usarlos acá.
Ahí estaba volviendo a descargar el complemento desde la carpeta de drive, pero es la misma versión que descargué ayer.

Score: +0

Dernière édition par PolloGuerrero, 03.07.2023 17:37

3575. El-Megalovano, 03.07.2023 23:51

Si hay modelos de voces Loquendo estaría más que agradecido. Yo haría varios de Eloquence o DECtalk.

Score: +0

3576. rmcpantoja, 04.07.2023 06:56

Hola @IA_speechsynth_and_GPT, los datasets (siempre que sean en formato LJSpeech) son compatibles, y en caso de que no lo sean se puede formatear, que son audios (carpeta wav o wavs) y transcripción (nombre.csv).
La transcripción sería de esta forma:

wavs/1	texto.
wavs/2	texto.

Para mejor estabilidad, es recomendable que el texto tenga puntuación final (,;.:-_¡!¿?, etc), excepto puntos suspensivos.
Algo también importante es que en caso de palabras desconocidas, verificar su pronunciación o fonemización usando el sintetizador espeak-ng, ya que piper usa espeak-ng como backend (fonemizador) tanto en el entrenamiento como la síntesis.
Los nombres de archivos de los audios pueden tener caracteres o números, pero siempre se acude a lo último por facilidad.
Aquí uno de los datasets que hice: https://drive.google.com/drive/folders/1_BkdO802JxjeppFLxnKotQuKVluDreYw?usp=drive_link

Score: +0

3577. CREADOR , 04.07.2023 13:05

Sáben si hay sintetizadores parecidos al lector de documentos de Edge, para jaws?

Score: +0

3578. Disquete, 04.07.2023 13:08

creo que no, si no entiendo mal edge usa las voces neurales como las de azure.

Score: +0

3579. pianino.64, 04.07.2023 15:27

tengo una pregunta, una vez creados los wavs y el texto, como creo esos archivos csv?

Score: +0

3580. PolloGuerrero, 04.07.2023 15:47

ah, excelente. Porque me encantaría poder usar estos datasets que ya hicieron de voces como Homero, que yo no tengo a la mano ni nada.
Po soy yo o a las voces de calidad Low no se les entiende un pomo? Al menos yo no entiendo ni j, no probé esas voces femeninas que tienen mls y unos números y leen cualquier cosa menos lo que hay. Me recuerda un poco a ese complemento de Alex de Mac, que pulsabas las letras y leía una cosa determinada para todo.

Score: +0

3581. llon, 05.07.2023 01:10

hola, e descargado el complemento de las voses tipo neuronales pipe y al reiniciar en NVDA me pide descargar una vos, le doy en la página luego de seleccionar la vos, pero me redirije a una página y no encuentro donde descargar la vos, me aparecen varios archivos pero no encuentro el adecuado alguien que me pueda oriantar gracias

Score: +0

3582. El-Megalovano, 05.07.2023 06:20

Tengo el mismo problema, no encuentro ningún archivo .tarGZ, solamente el source de las voces. Es que no se como utilizar el sitio de hughingface para descargar datasets y la verdad quiero descargar una voz en suahili que me gustó.
A demás tengo miedo de usar el colab ya quequiero hacer la voz de Eloquence para esta gaita, pero configurar algo yo no se la verdad yo no se. Primero creo los datasets pero en qué formato de texto hago las transcripciones? Se que tengo que seguir la convención LJSpeech, pero no se en qué formato guardaré las transcripciones para así subirlas y o enviarlas al colab. Si alguien o tiene las voces de Loquendo en la gaita o también las del Eloquence o quizá de Keinote gold sería interesante como sonarían.

Score: +0

Dernière édition par El-Megalovano, 05.07.2023 06:23

3583. PolloGuerrero, 05.07.2023 17:16

Chicos, yo no comprendo por qué el complemento redirige a los samples y no a las descargas de las voces ya compiladas. Sería lo ideal, o darte ambas opciones desde el manager y después vos elegís.
He auqí la página de los .tar.gz ya armados: https://github.com/rhasspy/piper/releases/tag/v0.0.2

Score: +0

Dernière édition par PolloGuerrero, 05.07.2023 17:17

3584. pianino.64, 05.07.2023 17:45

por eso siempre he dicho, viva eloquence por muchos años!.
quizás nunca llegara a tener la tegnologìa que ahora cargan las voces neurales, pero hasta para leer un libro es lo mas indispensable, a que es cierto lo que digo?.
arriba eloquence!

Score: +0

3585. El-Megalovano, 05.07.2023 18:57

Yo digo arriba eSpeak NG y su soporte multilíngüe, espero que el judeoespañol lo añadan... OK no XD cada uno con su sinte megalóvano.
Solo quiero hacer una versión de Eloquence para piper y ahí lo tengo como nuevo, a poco no chicos.

Score: +0

3586. Disquete, 05.07.2023 19:05

yo espero que añadan el gótico, inglés antiguo, otros dialectos de inglés y el que se ha mencionado (el judeoespañol)

Score: +0

3587. alaska , 05.07.2023 20:05

cómo que se actualizó el complemento Piper? Fui a descargar de drive y es el mismo que había descargado hace días cuando lo compartieron. piper_neural_voices-1.0-beta.nvda-addon. Y sobre la respuesta, es normal que sea así tan lenta pero ya es un avance poder utilizar voces neurales sin conexión. Y sobre estas que podemos utilizar con NVDA, digo que de las 11 hay 3 o 4 que suenan bien. Al menos para mi gusto.

Score: +0

3588. PolloGuerrero, 05.07.2023 21:02

Había tantos datasets que ahora se podrían usar en FakeYou y me encantaría usar acá en Piper también.

Score: +0

3589. rmcpantoja, 05.07.2023 21:13

Buenas.
teniendo la transcripción y el formato indicado (wav/archivo.wav|texto) basta para tenerlo en un archivo txt o csv, el cuaderno se encarga de arreglar la extensión.

piper para NVDA se actualiza en Github. Es la misma versión, pero en realidad hay cambios, sea para mejorar el rendimiento o para agregar cualquier otra cosa. El complemento de la carpeta de Drive está compilado con el último commit del repositorio de Mush, actualizando un componente para mejorar el rendimiento.

Es posible que sugiera o contribuya con un descargador automático debido al nuevo diseño de la página de samples y la subida de los nuevos modelos en huggingface.

Score: +0

3590. El-Megalovano, 06.07.2023 02:28

aH bien, ya veo en sí. Instalaré la versión proporcionada allí. Si alguna cosa que me suceda mientras entreno la(s) voz(ces) lo preguntaré.

Score: +0

3591. Caracolito, 09.07.2023 20:07

¡Hola! Parece que para instalar las voces del sitio de Piper, hay que saber en qué carpeta de NVDA colocar los archivos, y listo.

Score: +0

3592. PolloGuerrero, 10.07.2023 00:55

rmcpantoja, hay forma de que me lleguen notificaciones cuando hacés modificaciones a la carpeta de drive? estoy desde la web. De casualidad entré y encontré la voz que etiuetás como narrador, muy buena quedó para mi gusto.

Score: +0

3593. Disquete, 10.07.2023 11:16

yo me pregunto si es posible forzar que me salga la voz de piper en la lista de tts de NVDA. Actualicé y no me sale, me pregunto si es que tendrá que estar en sint drivers o una carpeta de esas.

Score: +0

3594. rmcpantoja, 10.07.2023 17:05

Hola @IA_speechsynth_and_GPT, me temo que no es posible hacerlo a través de Drive, pero justamente estaba diseñando un sistema de notificaciones en el cuaderno de exportación de modelos (una copia privada), en el que, si realmente voy a publicar una voz en la carpeta pública (léase el mensaje 3567) notificará por correo a quienes se suscriban a partir de ahora por la nueva voz exportada. Para los interesados, pueden proporcionar los correos por aquí o mensaje permanente.
@Symbian_Belle, asegúrate de que el complemento esté instalado de forma correcta, o revisar si se encuentra una carpeta pending-install dentro de los complementos de NVDA.

Score: +0

Dernière édition par rmcpantoja, 10.07.2023 17:07

3595. Yostein-san, 10.07.2023 17:13

He estado leyendo un poco sobre un nuevo sintesis de voz por IA.
Dicen que lo pueden usar con NVDA, alguien me puede dar una explicación introductoria acerca de ese complemento, a que esta destinado a usar, que se puede hacer, y que limitaciones tiene, y por ultimo me gustaría saber de sus requisitos minimos para su correcto funcionamiento.
Ya despues creo que pedire amablemente que me puedan dar un intructivo de su instalación.

Score: +0

3596. El-Megalovano, 10.07.2023 18:13

De el que estamos hablando es de Piper, un sintetizador de voz por IA pero local, sin internet, rápido y flexible que principalmente funciona para el Rasberry Pi 4, aunque también se puede usar por su puesto en Windows con NVDA. Para mac no se, aunque para Linux creo, ya que el mismo sistema (Rasbian) se basa en Debian, que utiliza el kernel de Linux para funcionar. Estoy tratando de crear una voz sintética para leer textos y siempre me fijé en hacer la mía para tal acción, a ver como va el resultado una vez esté lista. Ya voy a preparar los datasets para que funcione.

Score: +0

3597. Ricochet, 10.07.2023 18:30

intentaré portearla para Mac, si es que no lo está, a ver que pasa. Este fin de semana bichearé un poco con el código y a ver si hago mi primer aporte a la comunidad, que desde 2016 que no paso nada jajaja.

Score: +0

3598. pianino.64, 11.07.2023 05:16

bueno ya estoy preparado con mi primer dataset para piper, en que collab lo entreno?

Score: +0

3599. Rayo, 11.07.2023 05:18

no se que sea pero entre más haya en rvc mejor :D

Score: +0

3600. rmcpantoja, 11.07.2023 16:41

El cuaderno de entrenamiento: https://colab.research.google.com/github/rmcpantoja/piper/blob/master/notebooks/piper_multilingual_training_notebook.ipynb

Score: +0

4339 messages, 145 pages: 1…; 118 119120 121 122…; 145 ↖ Retour à la liste des sujets

Aller aux menus ↑
Aller au contenu ↑

Répondre au sujet

Vous devez être connecté pour pouvoir poster.