Có ai biết phần mềm nhận dạng Chữ Việt và Âm Việt không?

Phùng Anh Tuấn
(Patuan)

New Member
Nghe nói hiện nay đã có các phần mềm nhận dạng văn bản tiếng việt từ image, nhận dạng tiếng việt từ tiếng nói.
Đợt tới em phải số hóa nhiều thứ quá, giá có ai biết 2 phần mềm trên thì chỉ giùm em với.
 
VnDOCR có đến gần chục năm nay rùi. Mới mẻ rì.
 
Nhận dạng tiếng Việt từ tiếng nói :eek:
Hình như nó chỉ nhận dạng được cái file mình scan ra tiếng Việt (mặc dù vẫn còn lỗi tùm lum) chứ làm sao nhận được giọng nói nhỉ :-/
Đến mấy cái tiếng Anh người ta nghiên cứu mãi rồi còn chưa đâu vào đâu mà 8-}
 
Hồi trước có chương trình đọc tiếng Việt của trường Nguyễn Đình Chiểu, còn nhận dạng tiếng Việt thì chắc là chưa thể có vì ngay cả tiếng Anh cũng chưa đi đến đâu cả.
 
ừ, tiếng Anh có cái Dragon Nature Speaking nhận dạng tiếng nói nhưng nói chung là còn xa lắm mới hiểu được vì người ta chưa xác định được mã gốc của 1 âm từ, trong khi đó thì có quá nhiều biến thể mang tính địa phương của tiếng Anh, nhiều khi 2 người nói còn chả hiểu nhau.
tiếng Việt có ưu thế về âm vì không có nhiều âm dính liền, khả năng nhận dạng chính xác cao hơn, tuy nhiên là để nghiên cứu công nghệ này còn rất nhiều khó khăn, đặc biệt là về vấn đề tài chính, mình cũng thấy có mấy nhóm nghiên cứu về cái này nhưng đếu chưa đi đến đâu cả.
Về nhận dạng bằng scan thì chỉ có mỗi phần mềm VnDOcr, cũng được cty sản xuất nâng cấp chút chút, nhưng nói chung là chất lượng thua xa các nhận dạng nước ngoài do hệ thống dấu của tiếng Việt. Phần mềm nhận dạng tiếng Anh của Microsoft ofice chính xác đến 97% với văn bản sạch.
 
May ra thì dùng TTS thôi, STT thì tiếng Việt chưa có :D nếu có cũng chưa công bố & ko miễn phí đâu :D
 
TTS thì chẳng có rì đáng nói. Riêng về lập trình 1 chương trình TTS, hầu hết nguyên lý để lập trình 1 TTS tiếng Anh đều có thể áp dụng cho tiếng Việt. Mà cũng vì thế nên cái nì nhiều người làm lém rùi.
 
Đ.ch nói dựa vào đâu thế? Nếu không biết chắc chắn thì đừng nên viết lung tung.

Phạm Quang Ngọc đã viết:
Về nhận dạng bằng scan thì chỉ có mỗi phần mềm VnDOcr, cũng được cty sản xuất nâng cấp chút chút, nhưng nói chung là chất lượng thua xa các nhận dạng nước ngoài do hệ thống dấu của tiếng Việt.
 
TTS hầu như trường đại học nèo phải học về DSP cũng phải học qua cả anh ạ. :))

Còn VNDOCR, ai dùng qua rùi khắc thấy chất lượng của nó thế nèo.
 
Phần mềm nhận dạng tiếng Việt từ giọng nói có rồi mà,
Tuần trước em vừa xem "không gian IT", thấy có địa chỉ download nhưng k0 kịp ghi lại
 
Có thì chất lượng cũng cực kém. Nhìn vào mấy chương trình nhận dạng tiếng Anh thì thấy.
 
Back
Bên trên