[20070522] AVIM - Bộ gõ tiếng Việt tự động dành cho Web

Không hiểu anh Sơn có thực sự đọc mấy bài trước về vấn đề này chưa?

Thứ nhất, anh là một người làm việc rất nghiêm túc. Ở trên anh đã nói rằng đã đọc các bài tranh luận của Hiếu & anh Hà với Phạm Nguyễn Nhật Anh, thực tế là anh đã bỏ hơn hai tiếng ngày thứ bảy để đánh vật với cái topic dài ngoằng ngoẵng này, nghĩa là anh phải có anh mới nói, chứ không phải loại à uôm, chỉ lướt mắt qua rồi thì ré còi inh ỏi nhằm gây sự chú ý. Không, anh không phải thứ trẻ con đấy.

Thứ hai, anh hi vọng rằng khi em tranh luận với anh, nếu ai thấy mình sai thì hãy dám nhìn thẳng vào cái sai mà sửa, giống như cái vấn đề thuở hay thưở của em trước kia vậy. Chúng ta hãy tranh luận cho tới tận cùng của vấn đề, hãy đặt cái lẽ đúng là quan trọng hơn hết chứ đừng chỉ vì mỗi cái tôi, cái sĩ diện mà làm hỏng, hay làm chệch hướng cuộc tranh luận này.

-------
Bây giờ trở lại chủ đề chính của chúng ta. Trước tiên phải thống nhất với nhau về mặt lí thuyết thì mới có căn cứ, có cơ sở để tranh luận. Nếu bất cứ một trong ba luận điểm nào lấy làm chuẩn mực sau đây không có được sự nhất trí thì tranh luận mãi cũng vô ích.

1. Tiếng Việt là ngôn ngữ đơn âm tiết.

2. Đánh dấu thanh vào đâu cũng sai, vì vậy phải chọn một nguyên lí nào gần nhất với cách đã quen dùng. Đơn giản nhất, hợp lí nhất là đặt dấu thanh vào nguyên âm được coi là quan trọng nhất trong âm tiết, mà ta gọi là chính âm hay âm chính.

3. Phân âm tiết ra làm bốn phần: âm đầu, âm đệm, âm chính và âm cuối. (Ở đây, em tham khảo bảng minh hoạ về cách phân đoạn các thành tố của tiếng (theo chức năng và cương vị cấu trúc) trong bài viết của GS Hạo ở trang 5 và 6.)

Bây giờ anh sẽ bác bỏ cái lí chính của trường phái cũ, từ đó thấy được tính hợp lí của trường phái mới. Trường phái cũ cho rằng:

... mặc dù IPA là phương pháp biểu thị cách phát âm phổ dụng nhất nhưng không có nghĩa là cách biểu thị cách phát âm duy nhất cũng như không phải là cách biểu thị cách phát âm chính xác nhất vì vậy không có lí gì lại sử dụng nó làm chuẩn để quyết định cách bỏ dấu tiếng Việt mà không phải là một trong các phương pháp biểu thị cách phát âm khác.

Dựa vào luận điểm thứ hai để bác bỏ lí này. IPA không phải là công cụ hoàn hảo, nhưng nó chứng tỏ là công cụ tối ưu nhất so với bất kì một công cụ nào có cùng chức năng.

Để bắt bẻ lại thì có ba kẽ hở sau: hoặc luận điểm thứ hai sai, hoặc có một công cụ khác tốt hơn IPA, hoặc không nhất thiết buộc phải đánh dấu thanh vào chính âm. Trong ba kẽ hở này, cái cuối cùng là khả dĩ nhất để trường phái cũ giành ưu thế. Nhưng như vậy nghĩa là đi ngược lại ước muốn nhất quán triệt để trong cách đặt dấu thanh!

Ngoài lề:
Trong Hoá học người ta cũng vấp phải một nan đề tương tự. Anh xin nêu ra một ví dụ kinh điển. Các em viết công thức gạch nối của butađien như sau: CH2=CH-CH=CH2. Thực nghiệm cho thấy biểu diễn nối đôi & nối đơn như vậy chỉ mô tả được gần đúng bản chất liên kết giữa các nguyên tử cacbon trong phân tử butađien. Nhưng người ta vẫn phải chấp nhận cách viết đó vì nó là cách tối ưu.

Bây giờ anh bắt bẻ các ý em nói.

1.
Chú ý là, tác giả không nói kiểu bỏ dấu nào đúng - mà chỉ đề nghị ra một cách bỏ dầu chính tả nhất quán mặc dù theo tác giả chẳng có cách nào là đúng tuyệt đối cả.
...
Tức là, cũng dựa vào chính bài viết của tác giả Cao Xuân Hạo, cách bỏ dấu kiểu cũ đạt được cả 2 yêu cầu: là quy luật thống nhất (trình bày ở vài trang đầu) & gần nhất với cách quen dùng.

Em nghĩ tiếp đi, bỏ dấu nhất quán chẳng phải là đánh vào chính âm sao? Em đọc lại toàn văn mà xem, đặc biệt chú ý cái bảng ở trang số năm í nhé. Đọc xong rồi nhìn xem chính âm của chữ uỷ mà GS phân tích nó nằm ở chữ nào.

2.
Tuy nhiên, theo ý kiến chủ quan thì cách bỏ dấu kiểu cũ (như đã viết ở mấy trang đầu) mới là cách được phần lớn người Việt (ít nhất là người Việt đang ở trong nước - cộng đồng người Việt lớn nhất) sử dụng.

Phần lớn người Việt trong nước hử? Anh bác lại bằng hai điểm sau:

- Hội đồng Quốc gia chỉ đạo biên soạn Từ điển bách khoa Việt Nam (đã xuất bản trọn bộ bốn quyển, thống nhất theo quy tắc bỏ dấu mới có nằm trong Công văn được kí ngày 27.04.2000 bởi thủ tướng Chính phủ), Từ điển tiếng Việt (2008) của Trung tâm Từ điển học Vietlex do cố GS Hoàng Phê chủ biên (dân ngoại đạo biết đến GS chủ yếu qua cuốn Từ điển tiếng Việt xuất bản năm 1988 mà nó được tái bản hàng năm trong suốt hai thập kỉ qua), tạp chí Ngôn ngữ và đời sống, trang mạng ngonngu.net là những tổ chức hoạt động trong lĩnh vực ngôn ngữ chính thức công khai sử dụng lối đặt dấu thanh kiểu mới. Anh nói có bằng chứng hẳn hoi, nếu em chưa từng nghe/biết đến, anh sẽ đưa ra cho mà xem đàng hoàng, đầy đủ. Ngoài ra, một thứ mà em có thể "mục sở thị" ngay được: đó là em chạy ra hiệu sách, mở bất kì một quyển sách giáo khoa của NXB Giáo dục từ năm 2003 cho tới nay (dành cho cấp I, cấp cao hơn anh chưa xem nên không dám chắc chắn) tuân theo Quy định tạm thời về chính tả trong sách giáo khoa mới của Nhà xuất bản Giáo dục, 2002, mà trong nội dung của quy định này có đề cập đến việc đánh dấu thanh theo kiểu mới. Đối với anh, đây là "phần lớn người Việt trong nước" mà anh cho là đáng tin cậy.

- Còn cái phần lớn của em thì sao? Cứ giả sử thế này đi: em ra một phiên bản mới cho AVIM, trên trang chủ có thông báo rằng chuyển mặc định từ dấu cũ sang dấu mới, đồng thời không cho phép chỉnh cái mặc định này về kiểu cũ. Sau đó em ngầm thống kê xem có bao nhiêu người gửi phản hồi thắc mắc, trong số những người thắc mắc có bao nhiêu người phản đối. Hoặc đơn giản hơn thì giả sử thế này: dân đang học Ams hoặc đã ra trường có dân trí bình quân cao nhất trong các trường ở thành phố Hà Nội đi. Em lập một cái Poll với câu hỏi "Các bạn có biết cách đặt dấu thanh ở các vần oa, oe uy như thế nào là đúng không?". Lựa chọn một trong các câu trả lời sau đây: Kiểu cũ (òa òe ùy), Kiểu mới (oà oè uỳ), Chưa được học bao giờ, không biết. Anh đảm bảo rằng kết quả không như ý em đâu, mặc dù không cần (không thể) loại những câu trả lời thiếu trung thực.
 
Thứ nhất, anh là một người làm việc rất nghiêm túc. Ở trên anh đã nói rằng đã đọc các bài tranh luận của Hiếu & anh Hà với Phạm Nguyễn Nhật Anh, thực tế là anh đã bỏ hơn hai tiếng ngày thứ bảy để đánh vật với cái topic dài ngoằng ngoẵng này, nghĩa là anh phải có anh mới nói, chứ không phải loại à uôm, chỉ lướt mắt qua rồi thì ré còi inh ỏi nhằm gây sự chú ý. Không, anh không phải thứ trẻ con đấy.

Thứ hai, anh hi vọng rằng khi em tranh luận với anh, nếu ai thấy mình sai thì hãy dám nhìn thẳng vào cái sai mà sửa, giống như cái vấn đề thuở hay thưở của em trước kia vậy. Chúng ta hãy tranh luận cho tới tận cùng của vấn đề, hãy đặt cái lẽ đúng là quan trọng hơn hết chứ đừng chỉ vì mỗi cái tôi, cái sĩ diện mà làm hỏng, hay làm chệch hướng cuộc tranh luận này.
What's wrong? :))
Em nghĩ tiếp đi, bỏ dấu nhất quán chẳng phải là đánh vào chính âm sao? Em đọc lại toàn văn mà xem, đặc biệt chú ý cái bảng ở trang số năm í nhé. Đọc xong rồi nhìn xem chính âm của chữ uỷ mà GS phân tích nó nằm ở chữ nào.
Nguyên văn tác giả nói như đã trích dẫn ở bài trước là: bỏ dấu chỗ nào cũng sai, kiểu nào cũng sai. Tác giả chỉ đơn thuần nói là phải có 1 quy tắc chung và nhất quán (bác có vẻ không hiểu nghĩa đoạn này nên em giải thích qua: nhất quán tức là luôn luôn tuân theo cái quy tắc đó). Mà theo tác giả đề xuất thì đi theo IPA, tức là bỏ dấu kiểu mới. Ở đây thì khác, AVIM lựa chọn đi theo nguyên tắc mà phần lớn người Việt Nam theo (cái này sẽ lý giải cặn kẽ sau). Cũng có quy luật chung (đã là phần mềm thì phải có quy luật logic nếu không mỗi lần bỏ dấu nó sẽ ra 1 kiểu khác nhau) & chắc chắn là cũng nhất quán rồi.
- Hội đồng Quốc gia chỉ đạo biên soạn Từ điển bách khoa Việt Nam (đã xuất bản trọn bộ bốn quyển, thống nhất theo quy tắc bỏ dấu mới có nằm trong Công văn được kí ngày 27.04.2000 bởi thủ tướng Chính phủ), Từ điển tiếng Việt (2008) của Trung tâm Từ điển học Vietlex do cố GS Hoàng Phê chủ biên (dân ngoại đạo biết đến GS chủ yếu qua cuốn Từ điển tiếng Việt xuất bản năm 1988 mà nó được tái bản hàng năm trong suốt hai thập kỉ qua), tạp chí Ngôn ngữ và đời sống, trang mạng ngonngu.net là những tổ chức hoạt động trong lĩnh vực ngôn ngữ chính thức công khai sử dụng lối đặt dấu thanh kiểu mới. Anh nói có bằng chứng hẳn hoi, nếu em chưa từng nghe/biết đến, anh sẽ đưa ra cho mà xem đàng hoàng, đầy đủ. Ngoài ra, một thứ mà em có thể "mục sở thị" ngay được: đó là em chạy ra hiệu sách, mở bất kì một quyển sách giáo khoa của NXB Giáo dục từ năm 2003 cho tới nay (dành cho cấp I, cấp cao hơn anh chưa xem nên không dám chắc chắn) tuân theo Quy định tạm thời về chính tả trong sách giáo khoa mới của Nhà xuất bản Giáo dục, 2002, mà trong nội dung của quy định này có đề cập đến việc đánh dấu thanh theo kiểu mới. Đối với anh, đây là "phần lớn người Việt trong nước" mà anh cho là đáng tin cậy.
Bác nói năng thì có vẻ hiểu biết nọ kia, nhưng nghĩa của chính cái cụm "phần lớn người Việt trong nước" bác cũng đã hiểu đâu? Bác đánh đồng "phần lớn người Việt trong nước" với "các ông to trong nước" hoặc là "quy tắc của chính phủ". Dài dòng văn tự, vừa vào google thử mấy từ như là xóa, thủy, xòe, tỏa, khóe, hủy bỏ dấu bằng cả 2 cách thì cái nào ít nhất bỏ dấu kiểu cũ cũng cho ra kết quả tối thiểu là nhiều gấp vài lần bỏ dấu kiểu mới. Vẫn biết có thể là do tác giả các bộ gõ tiếng Việt từ trước đến nay thường thích bỏ dấu kiểu cũ hơn, thế nhưng mà nó lại thế này:

- 4 bộ gõ tiếng Việt cho web phổ dụng nhất: AVIM, VietTyping, mViet, VietUni (có thể tính cả CHIM vào thành 5 nếu muốn). Thì trong đó có 2 bộ gõ để mặc định là bỏ dấu kiểu cũ là AVIM & VietTyping, còn lại 3 bộ gõ kia đều để mặc định là bỏ dấu kiểu mới. Trong đó thậm chí VietUni còn không có cách nào để người dùng có thể dễ dàng chuyển sang bỏ dấu kiểu cũ được, mViet hình như cũng thế, CHIM hồi trước cũng thế, không biết giờ có biến chuyển gì chưa? Trong khi cả 2 bộ gõ để mặc định bỏ dấu kiểu cũ là AVIM & VietTyping đều cho phép người dùng có thể chuyển đổi giữa 2 kiểu bỏ dấu chỉ với 1 phím tắt. Đấy là còn chưa nói đến việc phấn lớn các website lớn nhất của Việt Nam hiện nay (như vnexpress chẳng hạn) đều sử dụng VietUni vì nó là bộ gõ tiếng Việt cho web phổ dụng đầu tiên.

- Về phần bộ gõ cho desktop, tớ dùng Linux thì có 2 bộ gõ tiếng Việt là xvnkb và unikey. Trong đó xvnkb mặc định bỏ dấu kiểu mới và unikey mặc định bỏ dấu kiểu cũ.

Thế nên cũng không thể viện cớ chẳng qua các bộ gõ mặc định kiểu cũ nên người ta chỉ gõ kiểu cũ được.

Phần lớn nó là như thế, chứ không phải hiểu theo nghĩa bác nghĩ: vài ông giáo sư bảo bỏ dấu kiểu mới thì vẫn là số đông so với cả chục triệu người Việt Nam đâu. Đấy là còn chưa kể đến việc chính một trong những vị giáo sư đó còn đã nói là bỏ dấu kiểu nào cũng sai tuốt rồi. Còn tại sao dùng IPA để xác định cách bỏ dấu tiếng Việt lại là bất hợp lí thì bác đọc lại cái đoạn đầu tiên em quote ở bài trước.
Hiếu:

FYI, version 02-11-2007 không work automatically với Drupal6 + FCKeditor module. http://drupal.org/project/fckeditor
Mục đích chính của bản 20071102 cũng là để bộ gõ hoạt động với FCKEditor (lúc đó là 2.4.x thì phải), từ đó đến nay ở cty em toàn dùng FCKEditor (giờ lên 2.5.x) chạy vẫn ầm ầm, hướng dẫn sử dụng ở đây: http://avim.veneroida.com.
 
Tranh cãi và đi sâu vào lí thuyết ngôn ngữ học với em ở thời điểm này cho thấy chả có tác dụng gì, vì lí thuyết về âm vị học tuyến tính, ngữ âm học và thanh học của em nó là con số không. Giờ anh nêu ra hai ý chính, là thực tế hiển nhiên thế này:

1. Trong cái "phần lớn" của em, 99% là những người không tìm hiểu/nghiên cứu về lí thuyết ngôn ngữ. Cứ đưa cho họ cái gì là họ dùng cái đấy, đa số chả quan tâm đến chuyện dấu mới dấu cũ. Lôi họ vào cái "phần lớn" của em, về mặt hình tượng, có khác gì xúi các bác nông dân ít chữ ra đấu lí với các nhà khoa học không?

2. Em xoay vấn đề sang chiều hướng "các ông to trong nước" là suy nghĩ tiêu cực rồi. Ở đây các "ông to" mà em nghĩ chỉ là những người có trách nhiệm kí công văn, quyết định cấp phép cho một cái gì đó có hiệu lực thi hành, chứ nghiên cứu cho ra kết quả rồi trình lên chính phủ là từ phía các nhà khoa học thuộc các viện nghiên cứu nhé.

Cái "phần lớn" mà anh nêu ra đó là:
- Từ điển bách khoa Việt Nam là sách để tra cứu.
- Từ điển tiếng Việt của cố GS Hoàng Phê là sách để tra cứu. Trung tâm Từ điển học Vietlex là do tư nhân tự thành lập ra từ 15 năm trước, không trực thuộc ban, bộ, ngành nào của Nhà nước cả.
- Sách giáo khoa là tài liệu chính thức để đào tạo nên những công dân tương lai của đất nước.
- Tạp chí Ngôn ngữ và đời sống là nơi trao đổi học thuật của các chuyên gia ngôn ngữ.

Tốt nhất là không nên lấy mấy báo điện tử dạng như VnExpress hay VietNamNet ra làm thí dụ, bởi vì đấy là những nguồn không đáng tin cậy về mặt chính tả chứ chưa nói đến vấn đề chuẩn hoá dấu mới dấu cũ. Về dấu mới dấu cũ, họ thả nổi cho các nhà báo tự do viết theo ý mình.

(Mục thứ ba này đặt nặng về lí thuyết, tôi nói với tất cả mọi người, những ai muốn dựa vào sở học của bản thân mà chỉ ra một chi tiết nào trong các lí luận sau đây là sai, chứ không phải như Hiếu, chỉ dựa theo thói quen của quần chúng, không có cơ sở lí luận khoa học nào.)
3. IPA dùng để biểu thị cách phát âm Việt ngữ có độ chính xác cao nhất, dùng nó để xác định chính âm cho một âm tiết là chính xác nhất. Tôi làm phép so sánh cho mọi người thấy ưu điểm của cách đánh dấu mới:

Thứ nhất,

- Tư tưởng trong nội dung mà cố GS Hạo đưa ra để đánh dấu thanh là một quy tắc duy nhất: đánh vào chính âm, nếu là nguyên âm đôi thì đánh vào yếu tố sau (trừ khi yếu tố này đặt ở cuối từ như kìa, tía...)

- Trong khi đó, theo truyền thống thì gồm 2 quy tắc: 1) Nếu vần có nguyên âm chứa mũ thì đánh dấu ở nguyên âm đó (ă, â, ê, ô, ơ, ư). 2) Nếu có phụ âm cuối thì đánh dấu lên nguyên âm chót (hoàn, soạt...), nếu không có thì đánh lên nguyên âm áp chót (hòa, thủy...)

Hai trường phái giống nhau ở chỗ: cùng thống nhất đánh dấu vào nguyên âm. Quy tắc thứ nhất của trường phái dấu cũ là thuần cảm tính, nó không dựa trên bất cứ một cơ sở lí thuyết nào cả.

Ở đây, tôi thấy cả hai trường phái đều có phần cảm tính trong cách bỏ dấu, nhưng trường phái cũ nặng cảm tính hơn. (Nếu muốn thì tôi có thể phân tích, so sánh kĩ lưỡng thêm về chi tiết này.)

Thứ hai,

Trường phái cũ sẽ lúng túng khi phải giải thích trường hợp viết quý nhưng lại viết túy trong khi hai tiếng quýtúy là đồng vận mẫu (có cùng mẫu vần như nhau). Điểm này thể hiện sự không nhất quán của trường phái cũ (cái này đã từng tranh luận một lần rồi).

Trong khi đó, nếu dẫn vào đây cách phân đoạn các thành tố của tiếng (phiên âm bằng kí hiệu IPA) thì vấn đề được làm sáng tỏ. (Đọc toàn văn bài GS Hạo mà tôi dẫn link trong bài viết trước.)

Có người dốt, vặn lại rằng: thế quảcủa thì sao, trôngđồng vận mẫu mà. Thực ra, dựa vào mặt mẫu tự để quy kết như vậy là đi ngược lại với chức năng của một công cụ (ở đây là chữ viết). Chức năng của chữ viết là để ghi lại tiếng nói một cách ước lệ chứ không phải lấy cấu trúc của chữ viết để quy định tiếng nói phải như thế nào. Ở đây, chức năng của quảcủa dùng để ghi hai tiếng khác nhau về vận mẫu, mặc dù nhìn mẫu tự là gần như nhau.

Nếu nói về vận mẫu (phát âm) giống nhau thì phải đem so sánh quả với toả. Nếu theo trường phái cũ thì phải viết là tỏa. Lại giống như cặp quý & túy ở trên, ta thấy cùng một vận mẫu mà vị trí bỏ dấu trên nguyên âm (trước sau) khác nhau. Trường phái cũ không giải thích được những trường hợp gần vận mẫu o/u như thế này, mà trong khi đó trường phái bỏ dấu mới lại giải quyết được.

Có thể đưa ra kết luận thế này: trường phái dấu cũ giữ nguyên si cách bỏ dấu trên các vận mẫu oa oe uy như trong Từ điển Việt-Bồ-La của linh mục Alexandro de Rhodes xuất bản năm 1651, tức là khi ghi tiếng Việt theo hệ chữ cái Latinh. Trong khi trường phái dấu mới cố gắng đưa thành tựu khoa học về cách ghi phiên âm vào việc xác định chính âm của một tiếng, nhằm đạt được một nguyên tắc nhất quán tốt nhất có thể, trong khi đó vẫn giữ được phần lớn vị trí bỏ dấu thanh như cũ trong tiếng Việt.

(Mục cuối cùng này chỉ là tưởng tượng cho vui thôi nhé.)
4. Một điều chưa xảy ra nhưng có thể dự đoán được: Nếu bây giờ Viện Ngôn ngữ học (trực thuộc Nhà nước) đưa ra hai nhu liệu sau: UniKey phảyAVIM phảy. Kèm theo đó là lời thông báo: mã nguồn sao chép của UniKeyAVIM, giữ nguyên cơ chế vận hành, chỉ chuyển cơ chế bỏ dấu trên các vần oa oe uy mặc định là kiểu mới cho phù hợp với quy tắc chính tả hiện hành.

Nhìn ở tầm vĩ mô, về lâu dài Hiếu thấy dân tình sẽ ngả theo xu hướng nào? Nếu ngả theo hướng mới, dân phát triển phần mềm như em hay anh PKLong sẽ úi xời một câu: Đơn giản, có gì ghê gớm đâu, mình đổi mặc định thành kiểu mới là xong mà. Nhìn khách quan sẽ thấy nực cười và tự hỏi: "Tại sao không chỉ đạo mấy ông phát triển phần mềm chuyển mặc định về mới cho rồi, lại còn sinh thêm ra phảy phiếc làm gì? Rõ thật là rắc rối!" "Không thể được, đó là cái tự do của người làm phần mềm, Nhà nước chẳng có quyền ép buộc, cấm đoán. À mà trước đây cũng có người người ta góp ý rồi đấy, nhưng ban đầu mấy ông làm phần mềm í không nghe." Rồi dân người ta sẽ dần chuyển hướng công kích.

Trình duyệt phổ biến nhất hiện nay là Windows. Bộ gõ tiếng Việt phổ biến nhất trên nền Windows là UniKey, trước đây là VietKey. Ba bộ gõ phổ biến nhất dành cho trình duyệt hiện nay được dùng trên khắp các diễn lớn nhỏ là AVIM, VietUniVietTyping (xếp theo thứ tự độ phổ biến). mViet chủ yếu dùng ở các diễn đàn của người Việt sống ở hải ngoại, đặc biệt là Mĩ, Canada.

Trong tất cả các bộ gõ phổ biến ấy, duy nhất chỉ có VietUni lấy mặc định là kiểu mới, thử hỏi lấy đâu ra ưu thế của kiểu mới so với kiểu cũ trên Google được chứ.

Bản thân em dùng Linux chỉ là thiểu số, nên cái tỉ lệ mặc định mới cũ 50:50 giữa xvnkbunikey chẳng nói lên gì nhiều. Hãy nhớ rằng Windows mới là phổ biến, trên nền Windows thì số tỉ lệ bản sao các bộ gõ được sử dụng có mặc định theo kiểu cũ là xấp xỉ 100% nhé.

Vì anh thấy cái AVIM của em tốt, mà nó lại có ảnh hưởng rộng rãi nhất trong đám bộ gõ tiếng Việt dành cho trình duyệt nên anh mới ra sức ý kiến ý cò, chứ không anh chả hơi đâu mà làm thế này.
 
Tóm lại là thế này:

- Bác không hiểu nghĩa của từ "phần lớn". Phần lớn theo em hiểu nó là trên 50% của 1 tổng thể. Bác lại cứ nhất quyết, mấy quyển sách do 1 số giáo sư nhất định viết là số lớn, bất kể thế nào, bởi vì theo bác "Trong cái "phần lớn" của em, 99% là những người không tìm hiểu/nghiên cứu về lí thuyết ngôn ngữ. Cứ đưa cho họ cái gì là họ dùng cái đấy, đa số chả quan tâm đến chuyện dấu mới dấu cũ.". Cái chuyện họ có hiểu biết gì không thì liên quan gì ở đây? Bởi vì như đã nói đi nói lại ở 2 bài trước, chính ông Cao Xuân Hạo cũng đã nói là bỏ dấu kiểu nào cũng sai hết, tức là ông nào đi chăng nữa, kể cả trình độ lớp 1 biết đọc biết viết lẫn trình độ giáo sư ngôn ngữ học như 2 vị trên thì cũng đều sai cả. Cái khác biệt duy nhất là ở mức độ phổ dụng của 2 kiểu mà rõ ràng là bỏ dấu kiểu cũ phổ dụng hơn hẳn. Nói thế thì lại bảo chẳng qua các bộ gõ toàn để mặc định kiểu cũ nên nó mới như thế, xin trả lời là không phải vì bộ gõ như thế nên phần lớn người ta bỏ dấu kiểu cũ mà là vì phần lớn người ta bỏ dấu kiểu cũ nên khi viết phần mềm lập trình viên mới thường đi theo lối đó. Đấy là còn chưa kể đến cái so sánh khập khiễng của bác, bác bảo xét về độ phổ dụng thì AVIM -> VietUni -> VietTyping, cái này đồng ý, thế nhưng đấy là mới chỉ tính đến yếu tố số lượng chứ chưa nói đến yếu tố chất lượng, AVIM có lẽ có đông đảo website dùng nhất, thế nhưng VietUni mới là bộ gõ có đông đảo người dùng sử dụng nhất, lấy ví dụ đơn giản, mấy site lớn AVIM được sử dụng có Wikipedia, Yahoo hỏi & đáp, DDTH, thế nhưng phải bao nhiêu lần cả 3 site này gộp lại mới có số lượng bài viết và người truy cập bằng được vnexpress, Dân Trí? --> 1 lần nữa, không thể đổ tại mặc định bộ gõ được. Vả lại, cả AVIM & VietTyping đều cho đổi cách bỏ dấu ở 2 vị trí, 1 là trong source code, 2 là bằng phím tắt. Cách thứ nhất là cho webmaster, cách thứ 2 là cho người dùng. Nếu webmaster cảm thấy không thích kiểu cũ là mặc định thì hoàn toàn có thể sửa lại - đừng nói là chính webmaster cũng không biết nên cứ để mặc định vì kiểu nào đi nữa, muốn dùng AVIM cũng phải mở code ra mà thêm ít nhất 1 dòng vào. Ngay cả trong trường hợp webmaster có thích kiểu cũ hơn, người dùng vẫn có thể chuyển kiểu bỏ dấu bằng phím tắt, lựa chọn này cũng được lưu lại để người dùng không phải chỉnh lại mỗi lần sử dụng AVIM - tức là chỉ 1 lần duy nhất - đơn giản & nhanh gọn.

- Đấy là dựa hoàn toàn vào bài viết chính bác post phía trước, tác giả có nói đến việc cả 2 cách bỏ dấu đều sai, phải chọn một nguyên tắc bỏ dấu và tuân theo quy tắc đó. Lại bảo AVIM không có quy tắc nhất định hay không tuân theo chính quy tắc đề ra đó đi (đừng nói thế, vì lập trình thì không thể có chuyện không logic được, không logic nó đã không thành được cái phần mềm).

- Cả AVIM, VietTyping lẫn Unikey đều là mã nguồn mở, cái giả định của bác thực ra cũng không far-fetched lắm đâu. Cái này cũng nói đi nói lại nhiều rồi, nếu muốn, cứ việc down AVIM về, sửa lại 1 kí tự (Chỉ 1 kí tự duy nhất mà thôi) trong file nguồn là có thể chuyển kiểu gõ mặc định sang kiểu mới, sau đó có thể upload lên cho download miễn phí với tên gọi khác, thậm chí với chính tên bác là tác giả (với điều kiện phải ghi rõ ràng là dựa trên AVIM). Có ai cấm bác đâu? Bác muốn kiểm chứng cái giả định của bác thì cứ việc làm. Chứ cứ ngồi đây mà đoán mò thì giải quyết được gì?
 
tks Hiếu, chạy rồi :D dạo này bù đầu, không có mắt mà nhòm ngó xung quanh nữa

bttrong example của em thừa một dấu "

<script src="path/to/avim.js" mce_src="path/to/avim.js"" ></script>
Về chủ đề thảo luận trên, anh đợt này bận không có thời gian đọc kỹ và đóng góp ý kiến, tuy nhiên có một điều nhắc nhở cà 2 thành viên. Khi thảo luận, TRÁNH sử dụng cách nói chê bai, khích bác nhau. Bắt đầu thảo luận như vậy, không dẫn đến đâu cả.

Xin cảm ơn
 
Chỉnh sửa lần cuối:
(Phần này là góp ý về cách bỏ dấu móc tiện lợi của AVIM cho tổ hợp nguyên âm "uo".)

Hiếu này,

AVIM (Các thiết lập: Kiểu gõ: Tự động, Chính tả: Bật, Bỏ dấu: Mới)
thuowr -> thuở (đúng) (sau uow không chung âm/kết âm/âm cuối, có dấu thanh)
uowng -> uơng (sai) (không thuỷ âm/âm đầu, có chung âm, không dấu thanh)
uowrng -> ưởng (đúng) (không thuỷ âm, có chung âm, có dấu thanh)
huow -> huơ (đúng) (không chung âm, không dấu thanh)
thuowng -> thuơng (sai) (có chung âm, không dấu thanh)
thuowrng -> thưởng (đúng) (có chung âm, có dấu thanh)

UniKey 4.0 RC1 (Các thiết lập: Kiểu gõ: Telex, Cho phép gõ tự do, Đặt dấu oà uý)
thuowr -> thuở (đúng)
uowng -> ương (đúng)
ưởng -> ưởng (đúng)
huow -> hươ (sai)
thuowng -> thương (đúng)
thuowrng -> thưởng (đúng)

Tóm lại:

- Với AVIM: khi có chung âm mà không có dấu thanh thì lối bỏ móc tiện lợi ouw sai.

- Còn UniKey: khi có thuỷ âm mà không có chung âm thì đúng với trường hợp thuỷ âm th, sai với thuỷ âm h. Vận mẫu trong tiếng Việt chỉ có thể kết hợp với thuỷ âm h, q, khth để thành huơ, quơ, khuơthuơ mà thôi. Chính vì cái vận mẫu này nó đặc biệt ít gặp nên anh Long, tác giả UniKey, không biết mà liệt kê thiếu vào cơ chế hook chăng? Dùng UniKey chẳng gõ được huơ gươm múa kiếm, toàn phải gõ nguyên âm rời rồi ghép vào. Nói đến hook là đi vào lĩnh vực lập trình rồi, chuồn thôi ;))

-------
(Phần này là tiếp tục tranh luận, có lấy một chút xíu ở phần trên để minh hoạ.)

1.
Lại bảo AVIM không có quy tắc nhất định hay không tuân theo chính quy tắc đề ra đó đi (đừng nói thế, vì lập trình thì không thể có chuyện không logic được, không logic nó đã không thành được cái phần mềm).

Khẳng định:
Em bị lẫn lộn giữa cấu trúc và chức năng của phần mềm.

Biện luận:
Em nói đúng, rằng "lập trình thì phải có lôgich", rằng "không lôgich thì nó không thành được cái phần mềm". Nhưng đó là nói sự lôgich trong cấu trúc nội tại của phần mềm.

Người sử dụng phần mềm thì chỉ quan tâm đến chức năng của phần mềm thôi. Cấu trúc tốt chẳng có nghĩa lí gì khi mà nó không đạt được yêu cầu về mặt chức năng.

Nói thế này sẽ dễ hiểu hơn: Những ngày đầu khi em công bố HIM/AVIM, nó chạy ổn định, tức là có cấu trúc tốt, nó lôgich. Nhưng thỉnh thoảng vẫn nâng cấp lên phiên bản mới hơn để sửa các lỗi. Vì sao? Vì về mặt chức năng bỏ dấu chính xác từ ngữ tiếng Việt, nó chưa được như mong đợi. Ngày xưa gõ thuowr toàn ra thưở đấy, mà trong tiếng Việt làm gì có thưở.

Em viết thế này: "Lại bảo AVIM không có quy tắc nhất định hay không tuân theo chính quy tắc đề ra đó đi." Anh không hề bảo rằng AVIM không có quy tắc nhất định, mà anh bảo là em dựa theo thói quen quần chúng, tức là theo quy tắc cũ, mà quy tắc cũ thì không có cơ sở lí luận khoa học. Rõ ràng là AVIM - một sản phẩm trí tuệ của em - nó có quy tắc, vì nếu gõ thế này thì nó sẽ ra thế này, gõ thế khác nó lại cho thế khác.

Nhưng khi dùng AVIM, với cái quy tắc mà cấu trúc nội tại của AVIM quy định, khi gõ nó cho kết quả, phải xem cái kết quả thu được đấy nó có đúng chính tả tiếng Việt hay không.

2.
Trong mục thứ 5 của toàn văn, GS Hạo viết:
Tuy vậy cũng có nhiều người còn căn cứ vào tiêu chuẩn "thẩm mỹ" để đánh dấu thanh vào giữa "từ" (đơn tiết), chẳng hạn như vào phía trên hay phía dưới chữ u của từ tuy: tụy, tủy, túy, tũy, mặc dầu chính âm của từ này là y chứ không phải là u. Lẽ ra nếu nhất quán với nguyên tắc nói trên thì phải viết tuý, tuỳ, tuỷ, v.v.

Đọc thì thấy rõ ràng là GS ủng hộ cách bỏ dấu mới. Thế mà em lại viết thế này:

Chú ý là, tác giả không nói kiểu bỏ dấu nào đúng - mà chỉ đề nghị ra một cách bỏ dầu chính tả nhất quán mặc dù theo tác giả chẳng có cách nào là đúng tuyệt đối cả.

Chẳng có cách nào tuyệt đối đúng, nhưng mà cách bỏ dấu mới nó hợp lí hơn cách cũ vì nó có cơ sở lí luận (mặc dù còn có phần cảm tính), còn cách cũ thì thuần cảm tính. Nói đến đây lại nhớ lại cái trường hợp butađien trong hoá học, rõ ràng thực nghiệm chứng minh rằng việc biểu diễn CH[SUB]2[/SUB]=CH-CH=CH[SUB]2[/SUB] là sai, ấy nhưng mà vẫn phải viết như vậy, vì nó phản ánh gần đúng nhất so với thực tế. Cũng giống như dùng IPA để phản ánh gần đúng nhất cái chính âm của một âm tiết, từ đó mà bỏ dấu.

3.
Đấy là còn chưa kể đến cái so sánh khập khiễng của bác, bác bảo xét về độ phổ dụng thì AVIM -> VietUni -> VietTyping, cái này đồng ý, thế nhưng đấy là mới chỉ tính đến yếu tố số lượng chứ chưa nói đến yếu tố chất lượng, AVIM có lẽ có đông đảo website dùng nhất, thế nhưng VietUni mới là bộ gõ có đông đảo người dùng sử dụng nhất, lấy ví dụ đơn giản, mấy site lớn AVIM được sử dụng có Wikipedia, Yahoo hỏi & đáp, DDTH, thế nhưng phải bao nhiêu lần cả 3 site này gộp lại mới có số lượng bài viết và người truy cập bằng được vnexpress, Dân Trí? --> 1 lần nữa, không thể đổ tại mặc định bộ gõ được.

- Thú thật là ở báo Dân trí thì anh không biết. Anh mới bấm vào Gửi bài viếtDân trí thì ra trang này:

Mã:
http://bandoc.dantri.com.vn/

Thử gõ tiếng Việt nhưng chả được. Nếu em biết làm sao để kích hoạt VietUni ở trang đấy để viết bài gửi cho Dân trí thì hướng dẫn anh nhé. Còn ở khung tìm kiếm ở trang chủ thì lại gõ tiếng Việt dễ dàng, nhưng khung tìm kiếm nó chả ảnh hưởng gì đến nội dung dấu mới dấu cũ của bài báo cả. Giả sử hai trường hợp: hoặc là anh không biết kích hoạt VietUni ở phần gửi bài, nghĩa là bài gửi được đặt dấu mới theo VietUni; hoặc là phải dùng UniKey để viết bài gửi, mà UniKey thì phần lớn là bỏ dấu cũ rồi.

- Với VnExpress, anh đã biết trước kết quả có lợi cho suy luận ở bài trước của anh, nhưng nói ra em không phục. Em cứ phóng xe ra chỗ toà soạn của nó í, rồi xin gặp chú Thắng tổng biên tập hay gặp Ban Biên tập thôi cũng được, xem các phóng viên, các kí giả gửi file .doc về toà soạn, hoặc gửi bài qua đường email hay sử dụng cái form có sẵn của VnExpress nhiều hơn nhé. Nếu là gửi file .doc hay gửi qua email thì vấn đề quay trở lại là UniKey phổ biến dấu cũ, còn nếu gửi qua form thì phổ biến là dấu mới.

Đấy, em cứ tìm hiểu kĩ bên VnExpress đi, rồi kết luận xem trong cái lí luận của anh, ngoài số lượng thì "chất lượng" nó có đạt không nhé. À, anh nghĩ không nên dùng "chất lượng" mà gọi là "tần suất được sử dụng" thì hợp lí hơn ;)
 
Chỉnh sửa lần cuối:
Có một, gọi thế nào nhỉ ko phải lỗi (chẳng biết nói thế nào, góp ý nhỏ vậy)

Khi copy từ word vào cái dấu " của word nó là “, và không gõ được tiếng việt sau cái dấu đó.


Nói chung cái issue này chẳng có ảnh hưởng gì nhiều cả :)
 
trong lúc còn đang tranh luận, không biết em Hiếu có thời gian sửa lại cái avim extension cho Firefox để nó chạy được trong FF3 thì tốt quá...
 
Chào mọi người, trong lúc còn đang tranh cãi thì mọi người có thể vào xem thử project này. Nói chung là bản FF ext thì avim ko thể so sánh vì nó không được hỗ trợ nhưng bản js dành cho web thì mudim cũng tốt hơn avim đấy.
 
Bạn Hoài Anh không nên nói thẳng toẹt ra là Mudim tốt hơn AVIM. Một bảng so sánh đối chiếu tự nó sẽ nói lên tất cả ;).
 
AVIM 20080728. Thay đổi:

- Viết lại cơ bản mã nguồn AVIM, cho tất cả vào class - giúp tránh xung đột có thể xảy ra với các scripts khác được gắn trong cùng trang.
- Cho phép tùy chọn các kiểu gõ được dùng bên trong kiểu tự động (Có thể chọn TELEX, VNI, VIQR hoặc chỉ TELEX & VNI hoặc chỉ TELEX hoặc thậm chí cả 4 kiểu gõ 1 lúc).
- Từ version này AVIM được phát hành 2 bản - 1 bản đã nén và 1 bản không nén. Bản nén có kích cỡ 18205 bytes (17.78kB), bản không nén có kích cỡ 40208 bytes (39.27kB). Bản chưa nén là bản được khuyến khích sử dụng do các host tốt hiện tại hầu hết đều có hỗ trợ nén tự động (thường là gzip) - cách nén này có hiệu quả hơn nhiều và chỉ hoạt động tốt với file chưa nén, đối với file đã nén trong 1 số trường hợp thậm chí kích cỡ file sẽ còn tăng lên 1 chút (thành khoảng 18, 19kB). Ngay cả trong trường hợp host không hỗ trợ nén tự động thì ngoại trừ trường hợp người dùng sử dụng đường truyền dial-up - gần 40KB cũng không phải là vấn đề - đấy là chưa nói đến việc sau lần đầu vào trang web, file avim.js sẽ được lưu vào bộ nhớ tạm --> chỉ phải download 1 lần.
- AVIM bản mới không còn hiển thị thông tin trên status bar do các trình duyệt lớn hiện tại đều mặc định không cho phép đổi thông tin trên status bar. Từ bản này AVIM sẽ chỉ hiển thị thông tin qua radio buttons & checkboxes. Do đó, các phím tắt như F7 -> F9 cũng sẽ không còn hiệu lực do nó có thể trùng với phím tắt được sử dụng bởi các trình duyệt.
- Từ bản này, mặc định AVIM sẽ tự động hiển thị 1 hộp nhỏ (semi-transparent) ở góc trái trên trình duyệt để hiển thị thông tin cũng như cho phép người dùng tùy biến - hộp này có thể bật/tắt bằng F12 hoặc có thể tắt hoàn toàn bằng cách đặt thuộc tính showControl trong file nguồn AVIM thành 0 - trong trường hợp này webmaster sẽ phải tự viết control box (xem http://noname00.com/hieu/pro/himtest.html). Hộp điều khiển này có thể được tùy biến, thay đổi giao diện qua 2 file đi kèm: transparent.png & avim.css.

Vì bản này có nhiều sửa đổi hơn hẳn các bản khác, tất cả người dùng nên thử trước tại: http://noname00.com/hieu/pro/himtest.html & đọc lại hướng dẫn tại: http://noname00.com/hieu/?page_id=26.

Bản Firefox extension giờ được phát triển bởi Minh Nguyễn. Bản mới nhất vừa được chấp nhận bởi Mozilla hôm qua. Thay đổi:

- Cho phép gõ dz & f ngay cả khi kiểm tra chính tả được bật.
- Hỗ trợ FF3.
- Thêm hỗ trợ cho 1 số WYSIWYG editor mới, bao gồm cả Dijit.Editor của Dojo.
- Tương thích với GMail.
- Tùy chọn cho phép extension tương thích với hầu hết các trang web khác có gắn sẵn bộ gõ tiếng Việt.
- Thêm tùy chọn trong menu cho phép chọn kiểu gõ trước hoặc sau.
- Không cho phép đổi thông số khi AVIM bị tắt.
- Thêm bản dịch tiếng Tây Ban Nha (kèm theo tiếng Anh & tiếng Việt).
- Thêm hộp thoại cho phép tùy chọn thông số AVIM.

Thông tin về extension (bao gồm cả download & install) xem thêm tại: https://addons.mozilla.org/en-US/firefox/addon/2947.

AVIM Demo: http://noname00.com/hieu/pro/himtest.html.
AVIM Download: http://sourceforge.net/projects/rhos.
Xem thêm tại: http://noname00.com/hieu.
 
Anh ơi, anh có thể làm thêm cả chương trình để dùng trên window được không ạ? Unikey và Vietkey đều đã lâu lắm không có cập nhật và hiện nay gặp rất nhiều lỗi trên win vista và một số chương trình mới khác.

À quên, em hỏi anh một chút ạ. Nếu bây giờ trong forum có một bộ gõ khác đang làm việc (không phải AVIM), em lại bật addon AVIM của firefox và bật cả unikey thì cái nào sẽ chiếm quyền hoạt động ạ? Cái bộ gõ trong forum trường em thì dở tệ, dùng điên cả người. Em đã đề nghĩ thay thế nhưng ông admin kĩ thuật nghỉ hưu rồi. Có cách nào để cái đó nó mất hiệu lực trong trình duyệt của em không ạ? Em dùng firefox 3.0.
 
Chỉnh sửa lần cuối:
Hiếu nên học hỏi thêm ở chủ đề này để hoàn thiện khả năng kiểm chính tả cho AVIM:
Mã:
http://code.google.com/p/mudim/issues/detail?id=16
 
AVIM 20080728. Thay đổi:

- Viết lại cơ bản mã nguồn AVIM, cho tất cả vào class - giúp tránh xung đột có thể xảy ra với các scripts khác được gắn trong cùng trang.
- Cho phép tùy chọn các kiểu gõ được dùng bên trong kiểu tự động (Có thể chọn TELEX, VNI, VIQR hoặc chỉ TELEX & VNI hoặc chỉ TELEX hoặc thậm chí cả 4 kiểu gõ 1 lúc).
- Từ version này AVIM được phát hành 2 bản - 1 bản đã nén và 1 bản không nén. Bản nén có kích cỡ 18205 bytes (17.78kB), bản không nén có kích cỡ 40208 bytes (39.27kB). Bản chưa nén là bản được khuyến khích sử dụng do các host tốt hiện tại hầu hết đều có hỗ trợ nén tự động (thường là gzip) - cách nén này có hiệu quả hơn nhiều và chỉ hoạt động tốt với file chưa nén, đối với file đã nén trong 1 số trường hợp thậm chí kích cỡ file sẽ còn tăng lên 1 chút (thành khoảng 18, 19kB). Ngay cả trong trường hợp host không hỗ trợ nén tự động thì ngoại trừ trường hợp người dùng sử dụng đường truyền dial-up - gần 40KB cũng không phải là vấn đề - đấy là chưa nói đến việc sau lần đầu vào trang web, file avim.js sẽ được lưu vào bộ nhớ tạm --> chỉ phải download 1 lần.
- AVIM bản mới không còn hiển thị thông tin trên status bar do các trình duyệt lớn hiện tại đều mặc định không cho phép đổi thông tin trên status bar. Từ bản này AVIM sẽ chỉ hiển thị thông tin qua radio buttons & checkboxes. Do đó, các phím tắt như F7 -> F9 cũng sẽ không còn hiệu lực do nó có thể trùng với phím tắt được sử dụng bởi các trình duyệt.
- Từ bản này, mặc định AVIM sẽ tự động hiển thị 1 hộp nhỏ (semi-transparent) ở góc trái trên trình duyệt để hiển thị thông tin cũng như cho phép người dùng tùy biến - hộp này có thể bật/tắt bằng F12 hoặc có thể tắt hoàn toàn bằng cách đặt thuộc tính showControl trong file nguồn AVIM thành 0 - trong trường hợp này webmaster sẽ phải tự viết control box (xem http://noname00.com/hieu/pro/himtest.html). Hộp điều khiển này có thể được tùy biến, thay đổi giao diện qua 2 file đi kèm: transparent.png & avim.css.

Vì bản này có nhiều sửa đổi hơn hẳn các bản khác, tất cả người dùng nên thử trước tại: http://noname00.com/hieu/pro/himtest.html & đọc lại hướng dẫn tại: http://noname00.com/hieu/?page_id=26.

Hiếu. Version này có vẻ không work trên Vbulletin-WYSIWYG. turn on/off auto thì work ở text editor thường, nhưng ở WYSIWYG thì không gõ được tiếng Việt.

anh chưa thử ở bản fresh VBulletin. tạm dùng lại bản cũ đã.
 
Back
Bên trên