Hilo oficial sobre los sintetizadores de voz

4317 сообщений, 144 страниц:  1; 126 127128 129 130; 144 ↖ Вернуться к списку тем

счёт: +42

3811. Exink,

Entrenar un modelo con kits es lo más simple del mundo, tanto que ya tengo dos modelos publicados. Lo malo es que ahora está muy, muy limitado en su uso, pero el entrenamiento es tan fácil como cargar uno o más audios en el dataset que no superen los 10 minutos, especificar si se trata de un cantante o personaje, el idioma y demás cuestiones, y cuando todo esté listo se le da a "train". Al menos, así fue la última vez que lo usé hace unas semanas.

счёт: +0

3812. Un-Duende-Fantasma-De-La-Navidad,

en qué sentido está limitado el este?

счёт: +0

3813. Ren_Yamamoto,

planes premium nuevos que nos mandan a los free a la mierd…

счёт: +0

3814. Un-Duende-Fantasma-De-La-Navidad,

aaa. pero, cuanto tiempo deja usar una voz, por ejemplo, pongo un audio o audios que no superen los 10 mins, cuanto tiempo deja digamos usarlos para covers y así una vez entrenado el modelo?

счёт: +0

3815. un_oso,

lo que ago es doy click aquí. New voice visitado enlace. luego di click donde dice create. me aparece un diálogo, simple mente le doy en continue. subo mis audios pero cuando intento continuar, me aparece esto. botón no disponible Continue. no se que esté haciendo mal, o que tenga que hacer en el dataser¿t. los audios que subo son de aprox 15 segundos

счёт: +0

3816. Un-Duende-Fantasma-De-La-Navidad,

yo ya pude iniciar con el entrenamiento, pero, me dice que tengo que verificar mi número, lo pongo, me llega el código, pero, la pag como que laguea y sale un error de aplicación o algo así, y si intento recargar pues lo mismo

счёт: +0

3817. inuyassha,

holaa jente bonita, pregunta curiosa, será que me pueden compartir el bocaloiz? y gracias a quien me pueda ayudar.

счёт: +0

3818. Un-Duende-Fantasma-De-La-Navidad,

esonosepideporaquí

счёт: +0

3819. Ren_Yamamoto,

oye, pobre man, del ilo de NVDA alguien lo mandó acá, tons hay que ir a putear al wei que lo mandó pa acá. a digo adjgkdgjlasdfjlkñ, anda, al menos díganle a donde preguntar, no sean malos :D

счёт: +0

3820. Un-Duende-Fantasma-De-La-Navidad,

antes yo obtenía cosillas de blindhelp project, pero, creo que esa pag ya no anda.

счёт: +0

3821. Ren_Yamamoto,

para @inuyassha, creo que hay un hilo que dice como hacer cantar al jaws? o algo así, y ahí pasan tipo música con vocaloid y cosas así. podrías intentar, si quieres y si te animas a postear lebanto ilo para que puedas pedirlo, no se, pondr´3e posteo a petición de @unmanquequierevocaloid, y yata. Edit: el ilo se llama: alguien sabe hacer cantar al jaws?

счёт: +0

Последнее изменение Ren_Yamamoto, 02.10.2023 15:11:17

3822. PrincesoGuerrero,

Ahora mismo la página de BlindHelp está en mantenimiento.

счёт: +0

3823. Zagreus,

talvez no les interese mucho, pero existe alter/ego. está bastante interesante, y es algo como un vocaloid, pero gratis, y se tiene que usar dentro de un daw, como reaper. aquí paso algo que yo hice, haciendo el cober de una canción:
https://1drv.ms/u/s!AgS04Pl7iLp2gdwLZJFKIE-NGxn38w?e=wCKohn
https://www.plogue.com/products/alter-ego.html
no me juzguen, fue de las primeras cosas que hice con esto. quedó mejor de lo que esperé.

счёт: +0

3824. clapmauricio,

Cuando intenté usar Alter/Ego, no logré activar el botón para añadir una voz, tanpoco comprendí donde se escribe cada sílaba. Hay un addon o algo así para la accesibilidad?

счёт: +0

3825. kanji-tatsumi,

Estuve probando XTTS y está bastante genial, no te dejará la voz exactamente igual pero es divertido xD. Alguien sabe cómo se puede hacer tu propia página sin limitaciones de caracteres? Porque la página dice que se pueden hacer versiones personales.

счёт: +0

Последнее изменение kanji-tatsumi, 08.10.2023 17:50:57

3826. El-Megalovano,

Se que quizá alguien posteó aquí, pero de sintetizadores de hace 2 décadas recuerdo a Rhetorical TTS que soportaba voces multilíngües a poco no lo conocían?

счёт: +0

3827. PrincesoGuerrero,

Yo lo conocía, pero nadie de nosotros lo pudo usar. Por dar un poco más de info, las voces eran buenísimas y eran el antecesor de lo que luego era scansofft.

счёт: +0

3828. El-Megalovano,

A lo mejor eran màs para uso empresarial que para el consumidor, asì como pasa actualmente con las actuales voces de Cerence o RealSpeaker. No estoy seguro ya que yo no lo conocì hasta por allà del 2014.

счёт: +0

3829. Caracolito,

Ooh sí, creo recordar que la dicción era algo exajerada, como marcando mucho algunas consonantes, pero sonaban muy bien.
Y una pregunta: ¿alguien tiene la versión 4 de las voces de Cepstral? Creo que esa era la mejorcita, en la 5 como que Miguel suena demasiado apagado...

счёт: +0

3830. El-Megalovano,

Yo no las tengo desafortunadamente.
Volviendo a Piper y se que publiqué el registro en el hilo asociado al tema, pero me da un error al intentar hacer una voz multi-speaker mientras elijo una finetuned voice. O estoy haciendo algo mal? O las frases coinciden con otros locutores? O algunas pasaron el límite de 15 segundos?
Y habrá una posibilidad que Piper añada soporte para voces multilíngües a lo Rhetorical?

счёт: +0

3831. FrancoBattiato,

Hola, buenas.
Oigan, hace poco vi un vídeo en el que mediante inteligencia artificial, hicieron cantar al presidente de México, entre otras personas famosas. Alguien tiene idea de como hacer eso? Me gustaría aprender como se hace eso.

счёт: +0

3832. El-Megalovano,

Yo pensaba en hacer lo mismo con la voz de skibidi dob dob yes yes...

счёт: +0

3833. Borja ,

No se, pero con omero jimiendo ya me traumé. Esto se fue al carajo.

счёт: +0

3834. PrincesoGuerrero,

Ah no, esto ya es demasiado.
No, lo de hacer cantar y tal es con modelos de voice to voice, no tts. es lo que se habla en el hilo este de hacer covers con IA.

счёт: +0

3835. El-Megalovano,

Ah pues nos equivocamos? Um perdón perdón...
Alguna solución con lo del problema de Piper?

счёт: +0

3836. FrancoBattiato,

Homero gimiendo? Donde se puede escuchar eso?

счёт: +0

3837. Laositadepeluche ,

juas como así? omero gimiendo? lóóóóóóóóóóóóól eso ni me lo esperaba! ups perdón por ese tipo de bromas jajaja mejor me dejo de bromas juas. enserio, donde se puede escuchar eso jajaja?

счёт: +0

3838. FrancoBattiato,

@Osita, está en YouTube, ahí lo escuché

счёт: +0

3839. PrincesoGuerrero,

Cuando lo encuentre y lo escuche, si me doy cuenta les digo, pero por ahora no se alarmen tanto. No creo que sea más que un audio de alguien gimiento transformado mediante vtv con la voz de Homero. Ya sería como demasiado recontra lol si también con TTS se llega a esto, cosa que no estamos tan lejos si tenemos en cuenta qué hace un TTS que funciona más o menos tipo GPT 3.5. Recordemos cómo se puede ir al carajo el coso en ElevenLabs cuando a ciertas voces le ponemos la estabilidad en 0.

счёт: +0

3840. Caracolito,

Hola! No sé si este mensaje corresponde para el hilo de NVDA o este, pero allá vamos.
Estoy queriendo probar la nueva versión de Piper para NVDA, pero se queda mudo. En el registro me sale lo siguiente:
ERROR - external:synthDrivers.piper_neural_voices._process_speech_sequence (13:27:01.166) - piper4nvda_asyncio (7172):
Failed to execute speech task <synthDrivers.piper_neural_voices.SpeechTask object at 0x057AD148>
Traceback (most recent call last):
File "C:\Users\leand\AppData\Roaming\nvda\addons\piper_neural_voices\synthDrivers\piper_neural_voices__init__.py", line 132, in _process_speech_sequence
await callable()
File "C:\Users\leand\AppData\Roaming\nvda\addons\piper_neural_voices\synthDrivers\piper_neural_voices__init__.py", line 104, in __call__
async for wave_samples in stream:
File "C:\Users\leand\AppData\Roaming\nvda\addons\piper_neural_voices\synthDrivers\piper_neural_voices\tts_system.py", line 186, in synthesize
async for ret in stream:
File "C:\Users\leand\AppData\Roaming\nvda\addons\piper_neural_voices\synthDrivers\piper_neural_voices\grpc_client__init__.py", line 148, in speak
yield ret
File "C:\Users\leand\AppData\Roaming\nvda\addons\piper_neural_voices\synthDrivers\piper_neural_voices\lib\grpclib\client.py", line 573, in __aexit__
raise exc_val
File "C:\Users\leand\AppData\Roaming\nvda\addons\piper_neural_voices\synthDrivers\piper_neural_voices\lib\grpclib\client.py", line 563, in __aexit__
await self._maybe_finish()
File "C:\Users\leand\AppData\Roaming\nvda\addons\piper_neural_voices\synthDrivers\piper_neural_voices\lib\grpclib\client.py", line 533, in _maybe_finish
await self.recv_trailing_metadata()
File "C:\Users\leand\AppData\Roaming\nvda\addons\piper_neural_voices\synthDrivers\piper_neural_voices\lib\grpclib\client.py", line 497, in recv_trailing_metadata
self._raise_for_grpc_status(status, message, details)
File "C:\Users\leand\AppData\Roaming\nvda\addons\piper_neural_voices\synthDrivers\piper_neural_voices\lib\grpclib\client.py", line 356, in _raise_for_grpc_status
raise GRPCError(status, message, details)
grpclib.exceptions.GRPCError: (<Status.UNKNOWN: 2>, 'Failed to obtain results', None)
Se lo envié por email al desarrollador del complemento, pero se lo muestro a ustedes por si alguno sabe cómo arreglarlo o le pasa lo mismo.

счёт: +0

4317 сообщений, 144 страниц:  1; 126 127128 129 130; 144 ↖ Вернуться к списку тем

Ответить на тему

Чтобы писать на форуме, вам нужно сначала войти.

Забыли пароль? Создать учётную запись