background

Sinteza vorbirii pornind de la text


In această pagină puteți testa mai multe variante de sinteză a vorbirii pornind de la text. În prezent oferim modele de sinteza atât pentru Română cât și pentru Engleză.

Sistemul de procesare si analiză a textului este dezvoltat de RACAI. Pentru generarea semnalului vocal folosim mai multe metode bazate pe corpus, cum ar fi:

  • Unit-selection (dezvoltat de RACAI): Este cea mai răspândită metodă de sinteză a vorbirii în sistemele comerciale - este de asemenea foarte dependentă de calitatea și cantitatea de date de antrenare

  • Sinteză parametrică statistică - un model este antrenat pentru a genera parametrii semnalului vocal pornind de la ieșirea platformei de analiză a textului

  • Sinteză hibrid - încă în lucru: este o metodă promițătoare care combină elemente din ambele sisteme de mai sus

Nota 1: Vocea de dimensiuni mari, este pusă la dispoziție de Speech Processing Group - Universitatea Tehnică din Cluj. Toate vocile sunt antrenate folosind parametrii NLP expuși de platforma RACAI.

Nota 2: O parte din funcționalitata de normalizare a textului a fost eliminată din acest demo. Din acest motiv, sunteți rugați să evitați folosirea abrevierilor și a expressilor ambigue și să introduceți textul în forma lui citibilă (de exemplu, în loc de a introduce direct numărul 102, folosiți forma expandată a acestuia 'o sută doi'), precum și utilizarea corespunzătoare a diacriticelor (în forma nouă 'ș', 'ț' în loc de 'ş', 'ţ') și a semnelor de punctuație. Vă mulțumim pentru întelegere.

Model folosit :
Textul dumneavoastră :