Lược sử tộc Việt

 

Tiếng Việt là ngôn ngữ có mật độ thông tin (infomational density) cao nhất trong 17 ngôn ngữ thuộc 9 hệ ngôn ngữ lớn trên thế giới!

Nghiên cứu của nhóm Pellegrino et al., (2011) thực hiện trên 7 ngôn ngữ: Anh, Đức, Pháp, Ý, Nhật, Quan Thoại, Tây Ban Nha, với tiếng Việt được lấy làm điểm tham chiếu (làm cơ sở để so sánh với các ngôn ngữ trên), kết quả cho thấy tiếng Việt là ngôn ngữ có mật độ thông tin cao nhất (=1), các ngôn ngữ khác đều có mật độ thấp hơn (<1) so với tiếng Việt (hình 1), các ngôn ngữ có mật độ thông tin gần nhất so với tiếng Việt là tiếng Anh và tiếng Quan Thoại.

Hình 1: Nghiên cứu của nhóm Pellegrino et al., (2011) thực hiện trên 7 ngôn ngữ: Anh, Đức, Pháp, Ý, Nhật, Quan Thoại, Tây Ban Nha, với tiếng Việt được lấy làm điểm tham chiếu. Kết quả cho thấy tiếng Việt là ngôn ngữ có mật độ thông tin cao nhất (=1), các ngôn ngữ khác đều có mật độ thấp hơn (<1) so với tiếng Việt.

 

Trong đó nghiên cứu cũng nhắc tới trường hợp tiếng Nhật với mật độ thông tin chỉ bằng một nửa so với tiếng Việt (1 so với 0.49), có nghĩa cùng một tốc độ, tiếng Việt truyền số thông tin gấp đôi so với tiếng Nhật, hay tiếng Nhật có tốc độ nhanh gấp đôi tiếng Việt thì cũng chỉ truyền lượng thông tin tương đương khi tiếng Việt nói với một nửa tốc độ của tiếng Nhật.

 

Nghiên cứu của Coupé et al., (2019) nghiên cứu trên 17 ngôn ngữ (Basque & Catalan (Tây Ban Nha), tiếng Đức, tiếng Anh, tiếng Pháp, tiếng Ý, tiếng Tây Ban Nha, tiếng Serbia, tiếng Nhật, tiếng Hàn, Tiếng Quan Thoại, tiếng Quảng Đông, Thái, Thổ Nhĩ Kỳ, Phần Lan và Hungary) cũng cho thấy kết quả tương tự, tiếng Việt là ngôn ngữ có mật độ thông tin cao nhất trong 17 ngôn ngữ được nghiên cứu.

Nghiên cứu đã tính toán mật độ thông tin của từng ngôn ngữ theo đơn vị bit – cùng một đơn vị mô tả tốc độ truyền thông tin của điện thoại di động, máy tính xách tay hoặc modem máy tính. Họ phát hiện ra rằng tiếng Nhật, chỉ có 643 âm tiết, có mật độ thông tin khoảng 5 bit cho mỗi âm tiết, trong khi tiếng Anh, với 6949 âm tiết, có mật độ chỉ hơn 7 bit cho mỗi âm tiết. Tiếng Việt, với hệ thống sáu thanh điệu phức tạp (mỗi thanh điệu có thể phân biệt thêm một âm tiết), đứng đầu bảng xếp hạng với 8 bit cho mỗi âm tiết (hình 2).

Hình 2: Tiếng Việt, với hệ thống sáu thanh điệu phức tạp (mỗi thanh điệu có thể phân biệt thêm một âm tiết), đứng đầu bảng xếp hạng với 8 bit cho mỗi âm tiết.

 

Các nghiên cứu này rất thú vị, giúp chúng ta biết thêm được một thông tin quan trọng về tiếng Việt. Trong cảm quan thường ngày, chúng ta có cảm giác tiếng Việt là một ngữ cô đọng, hàm súc, “nói ít hiểu nhiều”, nghiên cứu này đã làm rõ hơn cảm nhận đó, tiếng Việt là ngôn ngữ có mật độ thông tin cao nhất khi được so sánh với nhiều ngôn ngữ trên thế giới.

Ngôn ngữ cô đọng, đơn giản, có mật độ truyền thông tin cao cũng phần nào thể hiện được sự phát triển trong tư duy của những người nói ngôn ngữ đó, khả năng tư duy có thể giúp rút ngắn được số lượng các từ cần nói để có thể diễn đạt ý của người muốn nói, từ đó hình thành nên “chất lượng” của ngôn ngữ được thể hiện qua mật độ thông tin.

Đó cũng là một phần quan trọng trong di sản văn hóa của dân tộc Việt, tiếng Việt là ngôn ngữ mà người Việt đã giữ gìn từ thời Hùng Vương, vượt qua 1000 năm Bắc thuộc và qua những trắc trở của lịch sử, phát triển hoàn thiện tới ngôn ngữ cô đọng ngày nay mà chúng ta đang dùng.

Như Phạm Quỳnh đã nói: “tiếng ta còn thì nước ta còn”, tiếng Việt là tinh hoa, cũng chính là bản sắc, là linh hồn của văn hóa Việt, giúp dân tộc Việt còn đứng vững tới ngày hôm nay và mãi mãi sau này.

Việc hiểu được giá trị tiếng Việt qua nghiên cứu cũng là một nhắc nhở để chúng ta biết mình được kế thừa một di sản to lớn như thế nào, từ đó giữ gìn và góp phần làm giàu thêm ngôn ngữ vốn có của dân tộc.

Lược sử tộc Việt

Tài liệu tham khảo:

Coupé, C., Oh, Y. M., Dediu, D., & Pellegrino, F. (2019). Different languages, similar encoding efficiency: Comparable information rates across the human communicative niche. Science advances, 5(9), eaaw2594. https://doi.org/10.1126/sciadv.aaw2594

Full text: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6984970/

Pellegrino, F., Coupé, C., & Marsico, E. (2011). Across-Language Perspective on Speech Information Rate. Language, 87, 539 – 558.

Full text: http://ohll.ish-lyon.cnrs.fr/…/Pellegrino_to%20appear…