Hi Hiếu,
Anh cũng đang định sửa Unikey nên mới có mấy đề nghị như vậy. (Hiện nay cái H.I.M này đã hay hơn UniKey nhiều rồi, vì engine của UniKey chỉ nhả dấu kiểu cơ bắp thôi, không có kiểm tra gì cả).
Việc kiểm tra các tổ hợp nguyên âm thì thế này: Anh muốn là không bao giờ cho phép gõ dấu vào 1 từ mình biết chắc là không phải tiếng Việt. Giải pháp đơn giản là liệt kê tất cả tổ hợp các nguyên âm tiếng Việt (không dấu). Nếu 1 tổ hợp không thuộc danh sách đó thì không phải là tiếng Việt và không cho gõ dấu vào đó. Ban đầu tưởng là tiếng Việt có nhiều tổ hợp lắm, nhưng ngồi liệt kê ra anh thấy chỉ khoảng 50 tổ hợp thôi, nếu có implement chắc cũng không ảnh hưởng nhiều đến performance. Ví dụ: Hiện nay HIM vẫn cho gõ dấu trên các tổ hợp: io, ya, ... Nếu Hiếu cần anh có thể post lên đây danh sách ấy.
Chặt hơn một mức nữa thì có thể kiểm tra sự hợp lệ của các tổ hợp phụ âm tiền tố, hậu tố.
Ý tưởng thì là vậy. Còn làm ra liệu nó có đem lại tiện lợi cho người dùng hay không thì phải qua sử dụng mới biết. Anh còn chưa viết xong cho UniKey nên lên đây "xúi dại" để xem HIM ra sao, có gì học tập cho vào UniKey