Hi all,
1. VnVoice là phần mềm thương phẩm, do đó sẽ có phải trả tiền để sử dụng. Phần đóng góp của tôi trong VnVoice là rất rất nhỏ nên ko dám count credit. VnVoice là tên chung cho những giải pháp về nhận dạng & tổng hợp tiếng Việt của Phòng Nhận dạng & Công nghệ Tri thức, Viện Công Nghệ Thông Tin. VnVoice bao gồm nhiều moduls có thể tách bán riêng lẻ hoặc tích hợp như: giải pháp cho hệ thống UMS (Unifying Message System), giải pháp Vietnamese Text-to-Speech, giải pháp Vietnamese Commands. Kết quả độ chính xác đưa ra là những kết quả được làm trong phòng thí nghiệm. Chúng tôi hiện giờ chưa có khả năng kiểm tra trên diện rộng đại trà.
2.
"
Nguyên có tình cờ biết cái gì là cái mới so với bọn Tây trong phần mềm đó không? Ví dụ như nhét thêm ngữ pháp tiếng Việt hoặc 1 số đặc trưng nào đó? Hay đơn giản là dùng thuật toán của Tây và thay training set?
"
- Thứ nhất làm cho tiếng Việt => phải dùng mô hình ngôn ngữ phù hợp cho tiếng Việt, nghĩa là đương nhiên phải có thay đổi trong cây suy diễn văn phạm ngôn ngữ.
- Thứ hai "thuật toán của Tây" và "training set" là 2 vấn đề không đơn giản. Lí do, thường thì các thuật toán nó chạy tốt với training set này nhưng có khi lại hy sinh khi chạy set khác. Nên, phải xây dựng được một corpus đủ lớn gồm có training và testing sets sao cho có thể cover được một số lượng đáng kể các "khả năng". Nói suông thì chỉ 2 câu nhưng để làm corpus cho tiếng nói thì rất vất vả, mệt mỏi, và chán. Chỉ có điều ko làm thì ko có gì mà dùng.
3. Về Lips Movement, kĩ thuật này, mặc dù cũng đã cố gắng thu thập tài liệu. chúng tôi chưa có điều kiện nghiên cứu thử nghiệm. Điền Trang có thể cho tôi một số thông tin về lips movement được ko?
4. Vấn đề speech processing là một vấn đề lớn bao trùm & liên quan nhiều nhánh khoa học như: signal processing; natural language processing; pattern recognition; statistics & probability; linguistics; phonetics; neural network;... Chính vì vậy đòi hỏi một đội ngũ đông đảo người nghiên cứu am hiểu các khía cạnh này. Không rõ có bạn nào trong HAO cũng đang hứng thú với vấn đề này ko?
Nguyen