Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Ý nghĩa những con số và cách lấy duration label #1

Open
NDNM1408 opened this issue Apr 25, 2024 · 4 comments
Open

Ý nghĩa những con số và cách lấy duration label #1

NDNM1408 opened this issue Apr 25, 2024 · 4 comments

Comments

@NDNM1408
Copy link

Mình đang muốn lấy duration label của các từ Tiếng Việt. Mình có chạy thử code infer của bạn thì thấy ở mỗi từ có 1 con số. Mình đang thắc mắc không biết ý nghĩa của những con số này là gì. Ngoài ra bạn có thể chỉ cho mình cách lấy duration label của mỗi từ được không?

@v-nhandt21
Copy link
Owner

Ý bạn có phải về những con số cuối này không hén:

ây ɤ̆ j 1
ấy ɤ̆ j 5
ầy ɤ̆ j 2
ẩy ɤ̆ j 4

Nếu đúng thì nó là dấu của các word á bạn

@thivux
Copy link

thivux commented May 26, 2024

@v-nhandt21 anh cho em hỏi nếu symbol số ở cuối là dấu thì khi align duration mình expect duration cho các symbol số này là gì ạ?

@v-nhandt21
Copy link
Owner

@v-nhandt21 anh cho em hỏi nếu symbol số ở cuối là dấu thì khi align duration mình expect duration cho các symbol số này là gì ạ?

Nếu với các model dạng như fastspeech2, mapping từng frame với phoneme thì các số/ dấu về ý tưởng nó không có duration á bạn, nhưng nó sẽ ảnh hưởng tới thông số các phone khác, mình nghĩ thế.

Một giải pháp nữa là bạn có thể ghép các tone này vào chung nguyên âm luôn, kiểu như:

bận -> b ɤ̆ n 6 -> b ɤ̆6 n

@thivux
Copy link

thivux commented May 30, 2024

@v-nhandt21 em hiểu rồi ạ, thanks anh

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants