Bueno, lo primero es recopilar audios, cuantos más sean posibles, de ella hablando, y si es por el ruido o música de fondo hay IAs que arreglan esos detalles. A mí no me da el oído para ayudar con más, pero de ahí, tras lograr todo el conjunto de audios habría que cortar todos en archivos wav de 4 a 15 segundos. Bueno, me es re frustrante depender de otra persona para armar un dataset, pero a penas esté en condiciones quisiera volver a intentarlo, es decir la parte de aprender a cortar los audios, porque recopilar y pasarlos por estas herramientas de limpiarlos no lo veo como algo que no pudiera, aunque claro, hoy por hoy ni me voy a enterar del resultado. Hace meses no entreno una voz.
Score: +0
722. Willem,
así es, así se llamaba. y si todavía es posible conseguir una demo, podríamos armar el dataset sin problema, me parece. voy a investigar un poco y les cuento.
Score: +0
723. Disquete,
Oe preg. Cual es la empresa que hace el multi-TTS? Hay forma de mandarles mi modelo de NokiaTTS para que lo conviertan a un paquete usable desde MultiTTS en Android?
Score: +0
724. luna,
Buenas, disculpen la preguntadera, pero cómo se entrenan voces y tal?
Score: +0
725. Yostein-san,
Hola, quisierea que si es posible aclarar una duda. Desde que llego Piper tts, también ofrecio otro motor con las misma condiciones de voces hechas con IA, Sonata. Y Luego hubo otro nuevo motor en NVda complementos, llamado Indico tts, creo, y quisiera saber si alguien puede dar respueta que diferencias hay, porque puede que los trs sintesisadores tienen algo diferente que ofrecer.
Score: +0
726. El-Megalovano,
Este último que mencionas y quizá lo probé es de una compañía india, Hear2Read. Eso mientras Piper en sí mismo añada soporte a esos idiomas, dado que solo aparece el nepalí. Ya hay intentos de añadir soporte al hindi y otras lenguas índicas. Lo conocí primero cuando buscaba sintetizadores de voz para Android en otros idiomas y me topé con este. Como su nombre lo indica es un sintetizador de voz especializado en idiomas oficiales de la india, ya sean indoeuropeas (lenguas germánicas como el inglés indio o lenguas indoarias véase como el hindi, el guyaratí, el maratí, el odia, el bengalí, el asamés, el sánscrito, etc.) y lenguas drávidas (el támil, el télugu, etc). La versión de android utilizó síntesis paramétrica, mientras que en NVDA ah, sorpresilla... Fueron entrenadas via Piper.
Score: +0
Dernière édition par El-Megalovano, 17.02.2025 06:31