crear tu voz sintetizada?, es posible!.

54 Mensagens, 2 Páginas:  12 ↖ Voltar a lista de tópicos

Pontuação: +0

31. Nicky_Jam ,

Quedó buena tu voz pianín, es reconocible respecto a tu voz real (yo ya te esscuché por hacer podcast) pero tenemos todos el mismo inconveniente de voz enlatada cuando pasa a tonos grabes, vieron? Eso mismo sucede en las voces hechas por ellos mismos, así que es algo que no está en nuestro control.

Pontuação: +0

32. pianino64,

es cierto, pero veamoslo del lado positivo, nuestra voz suena a algo vintage, retro, al estilo speack and spell!.
sonamos a computadora bitec, pero tiene su encanto ahi!.

Pontuação: +0

33. Nicky_Jam ,

Sisi, yo porque no tengo tantos conocimientos de programación pero al ser esto software libre, les dejo mi voz a quienes quieran para integrarla a juegos o emulaciones de algo retro ya que creo que les quedaría muy bien.
Descarguen: https://1drv.ms/u/s!AlWjeyDBW3db_USlUAz4jEhQXu_d
Notas: Hasta ahora no pueden haber más de una voz instaladas simultáneamente porque remplaza archivos, y esto fue hecho en 2016 cuando recién empecé con todo, cuando ni siquiera iba a clases de canto aún. Lo que pasa que quería mantenerlo en secreto, pero ya está. Estuve regrabando algunas frases con la otra computadora y faltan muchísimas, y supongo que tanto el sonido en sí como el de mi voz cambiarían muchísimo pero esto es algo experimental, así que no importa.

Pontuação: +0

34. pianino64,


a que este proyecto no muera!, no sserviria de mucho y las sugerencias las hariamos llegar a los creadores

Pontuação: +0

35. el_pichon,

Investigando el APK me encuentro con varios ficheros llamados libahotts.so. Son dlls compiladas para Android. Y una sencilla búsqueda en Google demuestra que Aho TTS está desarrollado por la misma universidad que trabaja en Zure TTS. ¿Qué más se puede pedir? ¿Que sea de código abierto? Pues es de código abierto: https://sourceforge.net/projects/ahotts/files/

Pontuação: +0

36. Nicky_Jam ,

A mí lo que me interesa es poder compilarlas para NVDA en forma de addons. Yo creo que desde ahí e puede hacer algo tipo las distribuciones de RH, que es un sintetizador para ruso, ucraniano, inglés, esperanto y no sé si algún otro idioma pero no español, de momento. AL ser de código abierto se podría hacer algo para toda la comunidad y ahí es cuando cualquiera que quisiera puede aportar con su voz.

Pontuação: +0

37. pianino64,

si es de codigo abierto, pues llamamos a los programadores para ver que se puede hacer para convertirla en add on para n v d a o sapi 5

Pontuação: +0

38. Cristian ,

Manden muestras en audio jaja

Pontuação: +0

39. Yeri_mua ,

wiiii, esto está interesantísimo! pero a ver... cómo es esto? es decir... con solo instalar cualquiera de las voces que quiera usar y elejirlas como sintesis por default ya está? o hay que hacerr otra cosa? y... osea. la síntesis se puee usar con Talkback, o solo es para reconocer cciertas fraces que vengan integradas y así?

Pontuação: +0

40. pianino64,

revizando mi voz, teniendo en cuenta que he grabado 100 frases, mi voz tiene un asombroso tamaño de 13 a 15 mb, como es posible?.
ahora les explico.
estas voces, mas algunas de nuance y acapella, revivieron el viejo modo de síntesis bajo codigo de prediccion linear lpc.
este es un híbrido entre la síntesis concatenativa, y la síntesis bajo formantes.
lo voia tratar de hablarlo en un lenguaje que todos me comprendan.
se baza en dífonos, fonemas que previamente son grabados, estos se filtran y pasan a ser procesados por un sintetizador real con dos osciladores, diente de sierra y ruido blanco.
el diente de sierra es el remplazo de las vocales y sonidos tonales, y el ruido blanco reemplaza los sonidos no tonales y consonantes.
entonces las frases grabadas en audio pasan por este filtro, en el que los osciladores toman frecuencias y segmentos y otros segmentos los rechazan.
los segmentos o fonemas rechazados por el filtro, el sintetizador las reconstruye, pues estos osciladores cuentan con las frecuencias necesarias para hacerlo.
Tambien son capaces de reemplazar el tono del audio original, en ausencia de un tono en las grabaciones de audio, el back end del sintetizador los reconsruye, por eso es que a veces sonamos metálicos en tonos bajos, o si nos subimos el tono sonamos como mickey mouse.
en el pasado, el sintetizador podía reconstruyer hasta sílabas, y su resolución de convercion era bajisima, como de 8000 khz mas o menos, ejemplo lo podemos oír en los juguetes de los 80 como el speack and spell.
hoy en día el código de prediccion lineal es mucho más preciso y de mejor calidad.
ahora los filtros y osciladores pueden reconstruir frases completas en vez de sílabas como en el pasado, su resolución de audio tambien ha cambiado, ahora es de 22 o 44khz, y como antes, estas voces siguen siendo de tamaño pequeño.
aho tts trabaja bajo lpc, y su resolucion en su motor es de 22 khz, bastante bien logrado.

Pontuação: +0

41. Nicky_Jam ,

Éste justamente utiliza un tipo de síntesis más moderno conocido como síntesis mediante modelos ocultos de Marcov, que también lo podemos encontrar en Google TTS (voces sin conexión al menos) voces de Microsoft desde Speech Platform hasta Windows 10, voces compactas de Vocalizer, voces colibri de Acapela, Svox pico, Samsun TTS...
Acá hay algo que descubrí hace unos años. Nadie lo hizo vaya a saberse por qué, pero estos sintetizadores podrían cantar tranquilamente si se programaran las tags adecuadas porque tienen flexibilidad en cuanto a parámetros de voz, lo que es tono, entonación y demás. Acá no lo vamos a poder hacer salvo agregando la posibilidad en el código fuente, pero lo descubrí gracias a un bug que hubo en una update en Windows 10 con la voz mexicana de Cortana, donde según el valor del parámetro del tono éste subía o bajaba a lo loco... Y yo dije, para un bug como ese se podría hacer algo mucho más útil. AHora no tengo eso para mostrarles, o eso creo... Déjenme ver algo:
Bueno, acá está: escuchen lo que sucede, es la voz mexicana de Cortana (bug ya arreglado)
https://www.blindworlds.com/sites/default/files/private/publicacion/116712/cortana-mexicana-cagada.mp3

Pontuação: +0

42. BOFH ,

me pregunto si los APKs son firmados. ¿Se podrán subir a Google Play?

Pontuação: +0

43. pianino64,

creo que no a menos qe hagas tu vesion bajo codigo fuente.

Pontuação: +0

44. rodrigo,

No puedo descargar el código Fuente

Pontuação: +0

45. Princeps-Tenebris ,

quienes más hayan hecho su voz postéenlas, esto es muy interesante.

Pontuação: +0

46. pianino64,

por ahi alguien esta grabando sus 100 frases, cuando esa persona tenga listo su a pk nos avisara

Pontuação: +0

47. Nicky_Jam ,

Por supuesto esa persona es libre de dibulgar o no su voz sintética. A mí me sirvió mucho lo que hice en su momento aunque en principio lo mantuve en secreto, pero más adelante voy a ver cómo desarrollar un engine propio aunque fuera basado en Festival porque desde luego éste no iba a ser el producto definitivo, sinó un experimento.

Pontuação: +0

48. pianino64,

oye fer, tienes dos obciones si no quieres mas hacer con zure tts.
de un lado, con microsoft azure., toca inscribirse, y crear datos de voz a partir de archivos wav y archivos de texto txt.
o sino, reune 800 dólares y create tu modelo con cereprog.

Pontuação: +0

49. marciano ,

Hola... pues, yo últimamente estaba batallando con zure tts en cuanto a el capcha... Es difícil de resolver: He intentado de muchas formas, buscando convertidores de texto de arte ascii a letras, o números, pero núnca me funcionó. He pedido ayuda visual por chat, y me dicen que solamente están líneas, además aprendí un poco del arte ascii, o sea por ejemplo el | (barra bertical) es el número 124 pero ni al caso, no me funciona.

Pontuação: +0

50. nicodj,

al leer un texto o algo me dice esto.
lo sentimos: la aplicación zuretts se detuvo. y no me deja darle aceptar

Pontuação: +0

Última edição por nicodj, Aug 13 2019 20:06:16

51. pianino64,

me solia pasar con la voz que traia por defecto, con mi voz no he tenido problemas, y no se por que te dio problema a ti

Pontuação: +0

52. marciano ,

¿Será por que falta un enjine? Si no es así corríjanme.

Pontuação: +0

53. Nicky_Jam ,

No falta nada, es la app que a veces anda pra el ojete aunque no llegó a uscederme eso a mí.

Pontuação: +0

54. Princeps-Tenebris ,

bueno, hasta ahora solo se han escuchado voces masculinas, sería genial escuchar alguna voz femenina ya creada, la app oficial de play tiene una voz femenina pero es euskara.

Pontuação: +0

54 Mensagens, 2 Páginas:  12 ↖ Voltar a lista de tópicos

Responder ao tópico

Você deve estar conectado para poder postar.

Esqueceu sua senha? Criar uma conta