ừ, tiếng Anh có cái Dragon Nature Speaking nhận dạng tiếng nói nhưng nói chung là còn xa lắm mới hiểu được vì người ta chưa xác định được mã gốc của 1 âm từ, trong khi đó thì có quá nhiều biến thể mang tính địa phương của tiếng Anh, nhiều khi 2 người nói còn chả hiểu nhau.
tiếng Việt có ưu thế về âm vì không có nhiều âm dính liền, khả năng nhận dạng chính xác cao hơn, tuy nhiên là để nghiên cứu công nghệ này còn rất nhiều khó khăn, đặc biệt là về vấn đề tài chính, mình cũng thấy có mấy nhóm nghiên cứu về cái này nhưng đếu chưa đi đến đâu cả.
Về nhận dạng bằng scan thì chỉ có mỗi phần mềm VnDOcr, cũng được cty sản xuất nâng cấp chút chút, nhưng nói chung là chất lượng thua xa các nhận dạng nước ngoài do hệ thống dấu của tiếng Việt. Phần mềm nhận dạng tiếng Anh của Microsoft ofice chính xác đến 97% với văn bản sạch.