Trung tâm Nghiên cứu Ngôn ngữ học Tính toán Paul Sidwell (Bangkok) & Đại học Quốc gia Úc (Canberra)
Giả thuyết Trung tâm Sông ngòi Nam Á
Bài báo này phân tích các vấn đề phức tạp liên quan đến quê hương và sự phân tán của ngữ hệ Nam Á (Austroasiatic, AA). Một phân tích phê phán cho thấy ít bằng chứng thuyết phục hỗ trợ các nhóm phụ lồng nhau trong số mười ba nhánh được công nhận, trong khi các phân tích từ vựng gợi ý một mô hình tiếp xúc và hội tụ kéo dài trên lục địa Đông Nam Á. Những phát hiện này được diễn giải là phù hợp với sự hiện diện lâu dài và ổn định tại Đông Dương, có thể tập trung quanh lưu vực sông Mê Kông. Nhánh xa nhất về mặt địa lý — Munda ở Ấn Độ — được xem là một nhánh ngoài với mức độ đổi mới cao, và quá trình tiến hóa của cấu trúc gốc Munda được tái dựng, củng cố giả thuyết này.
Từ khóa: Ngữ hệ Nam Á, Munda, phương pháp so sánh, quan hệ ngôn ngữ, thống kê từ vựng.
Giới thiệu
Việc xác định quê hương của ngữ hệ Nam Á (AA) là một vấn đề quan trọng và ngày càng cấp thiết đối với các học giả nghiên cứu thời tiền sử của Đông Nam Á lục địa. Một phân loại phả hệ ngôn ngữ có thể cung cấp thông tin cho các cuộc thảo luận về vấn đề này, bởi mối tương quan giữa phân bố địa lý và cấu trúc phát sinh loài cho phép suy luận về các tuyến di cư, mối quan hệ ngôn ngữ, và độ sâu thời gian. Trong bối cảnh này, thật đáng chú ý và đáng thất vọng khi sau hơn một thế kỷ nghiên cứu so sánh AA, các học giả vẫn chưa đưa ra được một phân loại di truyền nội bộ toàn diện và được biện minh rõ ràng của ngữ hệ này (xem Sidwell 2009 để biết tổng quan).
Chắc chắn, đã có nhiều đề xuất khác nhau được công bố trong các tài liệu in và các nguồn không chính thức như luận văn, bài thuyết trình hội nghị, và bản thảo lưu hành nội bộ. Tuy nhiên, khi các nguồn này được truy vết, so sánh và phân tích, rõ ràng không có sự đồng thuận học thuật về:
— Mối quan hệ giữa các nhánh AA;
— Độ tuổi hoặc mức độ đa dạng của AA;
— Một chương trình nghiên cứu phù hợp để giải quyết các vấn đề này.
Do đó, lĩnh vực này chưa được hưởng lợi đáng kể từ các nghiên cứu liên ngành. Các học giả mong muốn tích hợp khảo cổ học, di truyền học và ngôn ngữ học đang gặp nhiều khó khăn, như Roger Blench đã chỉ ra gần đây:
> Phân loại [AA] vẫn còn mơ hồ. Di truyền học của các cộng đồng nói tiếng Nam Á hầu như chưa được nghiên cứu. Theo truyền thống, AA được chia thành hai phân họ: Mon-Khmer (ở Đông Nam Á) và Munda (ở Ấn Độ). Diffloth (2005, 79) hiện xem AA có ba nhánh chính, nhưng không có bằng chứng nào cho sự sắp xếp này được công bố. Thực tế, phân loại AA bị cản trở bởi việc thiếu công bố dữ liệu, khiến việc đánh giá các giả thuyết cạnh tranh từ bên ngoài trở thành một hoạt động suy đoán thuần túy. (Blench 2008, 117-118)
Bài báo này lập luận rằng mười ba nhánh AA tỏa ra gần như đồng đều từ proto-AA. Vì số lượng nhánh AA lớn nhất được ghi nhận dọc theo một trục trải dài từ đông nam đến tây bắc, gần đúng với lưu vực trung lưu sông Mê Kông, nên hợp lý khi giả định rằng các ngôn ngữ AA đã phân tán dọc theo và ra khỏi trục này. Giả thuyết này được tạm gọi là Giả thuyết Trung tâm Sông ngòi Nam Á.
Các quan điểm gần đây: Ấn Độ và Trung Quốc
Kể từ nửa sau thập niên 1990, đã có sự gia tăng quan tâm đến ngôn ngữ học AA và vấn đề quê hương. Trong số các đề xuất khác nhau được đưa ra qua nhiều năm, hai hướng nghiên cứu chính được nhấn mạnh:
1. Nguồn gốc phương Tây, tại miền đông Ấn Độ hoặc khu vực Vịnh Bengal;
2. Nguồn gốc phương Bắc, tại miền trung hoặc miền nam Trung Quốc.
Gerard Diffloth (2005 và các công trình khác) lập luận rằng, dựa trên từ vựng liên quan đến thực vật và động vật, vốn từ AA loại trừ các vùng ôn đới (như Trung Quốc) và ủng hộ vùng nhiệt đới. Với giả định về sự phân chia chính giữa Munda và Mon-Khmer trong AA, ông đề xuất quê hương gần Vịnh Bengal (trước đó từng đề cập đến vùng biên giới Miến Điện-Vân Nam). George van Driem đã tích cực ủng hộ quan điểm này qua các ấn phẩm (đặc biệt trong Languages of the Himalayas, 2001). Van Driem đưa ra nhiều tài liệu dường như xác nhận sự hiện diện của nền tảng Munda cổ trong văn bản Vệ Đà (xem Kuiper 1955, 1967, 1991; Witzel 1999).
Ngược lại, Peiros (1989, 1998) và Peiros & Shnirelman (1998) khẳng định rằng từ vựng AA gợi ý một khu vực không nhiệt đới, không ven biển. Kết hợp ý tưởng này với dữ liệu khí hậu giữa thế Holocen và các điểm tương đồng từ vựng được cho là có với ngữ hệ H’Mông-Miên (khoảng hai chục hoặc hơn các điểm tương đồng), họ đề xuất nguồn gốc từ trung lưu sông Dương Tử. Quan điểm này phù hợp với các ý kiến của các nhà ngữ văn học về nhiều từ nguyên AA cho các từ có nguồn gốc không rõ trong các ngôn ngữ cổ điển Trung Quốc. Mei & Norman (1976) được trích dẫn rộng rãi khi đề xuất các từ mượn AA vào tiếng Hán, bao gồm cả tên của sông Dương Tử. Gần đây, Schuessler (2007) đưa ra hàng trăm phép so sánh giữa tiếng Mon-Khmer và tiếng Hán cổ, đến mức ông viết (tr. 4):
> Khi truy nguyên các từ nguyên của tiếng Hán cổ (OC) và các ngôn ngữ Tạng-Miến/Sino-Tạng (TB/ST), người ta thường cảm thấy chạm đến một nền tảng Nam Á, tức là có chung nguồn gốc với AA.
Tuy nhiên, các lập luận ngữ văn này có đặc điểm là chỉ có một số ít điểm tương đồng ngữ âm và ngữ nghĩa hấp dẫn, cùng với hàng chục hoặc nhiều hơn các điểm tương đồng mơ hồ, không thể sắp xếp thành hệ thống tương ứng chặt chẽ. Đáng tiếc, đây là điều thường thấy khi so sánh các ngôn ngữ không liên quan nhưng có kiểu hình tương tự. Hiện tại, không có lý do rõ ràng để ủng hộ trường phái “thân Trung Quốc” hay “thân Ấn Độ”. Thực tế, chúng ta không nên xuất phát từ tiền đề truyền thống của các nhà ngữ văn học rằng việc tìm kiếm nguồn gốc từ vựng Latin nên bắt đầu từ sông Tiber. Các lập luận ngữ văn khác nhau định vị quê hương proto-AA tại những khu vực hiện nay có rất ít hoặc không có sự đa dạng AA. Không có cộng đồng nói tiếng AA nào dọc theo trung lưu sông Dương Tử hoặc ở các tỉnh đông nam Trung Quốc. Cũng không có cộng đồng AA nào quanh Vịnh Bengal, và nhánh gần nhất với mức đa dạng hợp lý — Munda — có thể không đủ đa dạng để củng cố lập trường này (xem thảo luận dưới đây).
Trong hơn một thế kỷ, kể từ Sapir (1916), người ta công nhận rằng sự đa dạng trong một ngữ hệ tăng theo thời gian, do đó một khu vực có đa dạng cao hơn có khả năng được định cư lâu hơn và gần với quê hương hơn. Dyen (1956) và Diebold (1960) đã hệ thống hóa ý tưởng này dưới tên Lý thuyết Di cư, và phương pháp này được áp dụng trong nghiên cứu này. Tính hiệu quả của lý thuyết được xác nhận trong thực tế; ví dụ, miền Nam Việt Nam được người nói tiếng Việt định cư kể từ khi Chămpa sáp nhập vào Việt Nam năm 1693, và sự đa dạng phương ngữ tiếng Việt ở miền Nam thấp, nhưng cao hơn đáng kể ở miền Bắc, đặc biệt quanh khu vực Vinh.
Nhiệm vụ hiện tại là đánh giá các đặc điểm của AA và xác định liệu có thể mô tả chính xác sự đa dạng phát sinh loài của chúng hay không. Dù không thể tranh cãi rằng phần lớn ngôn ngữ AA được nói tại khu vực mà tôi gọi là “vùng trung tâm”, câu hỏi liệu chúng có đại diện cho tỷ lệ lớn hơn các nhánh tọa độ hay không vẫn cần xem xét. Do đó, cấu trúc nhánh cấp cao của AA là trọng tâm của phân tích này.
Phân loại AA từ Pinnow (1959)
Hiện nay, quan điểm được chấp nhận rộng rãi là ngữ hệ AA gồm hai phân họ tọa độ:
> Sự phân chia chính trong ngữ hệ này là giữa các ngôn ngữ Munda ở miền trung và đông Ấn Độ và phần còn lại của ngữ hệ. (Anderson 2006, 598)
Tuy nhiên, một quan điểm khác cũng được ghi nhận:
> Ngữ hệ Nam Á thường được chia thành ba nhánh hoặc phân họ, cụ thể là ngôn ngữ Munda, ngôn ngữ Nicobar, và ngôn ngữ Mon-Khmer. (van Driem 2001, 262)
Cả hai đề xuất đều gán cho Munda một vị trí đặc biệt, bắt nguồn trực tiếp từ các công trình của Pinnow (1959, 1960, 1963, v.v.). Trong bài báo năm 1960, Pinnow mô tả Munda như bảo tồn các phức tạp hình thái cổ xưa, chỉ còn dấu vết mờ nhạt trong các nhánh AA khác, như sự thay đổi phụ âm cuối trong tiếng Khmer. Đến năm 1963, ông trình bày một phân loại được tái hiện tại Hình 2, chia AA thành hai phân họ: phương Tây (Munda) và phương Đông (Khmer-Nicobar), với Mon-Khmer được chia thành Nicobar và “Palaung-Khmer”. Đây là nguồn gốc của cả hai quan điểm được trích dẫn. Các nghiên cứu trước đó, như Schmidt (1906), lại gán Munda một vị trí thấp hơn, xếp nó cùng các ngôn ngữ Đông Dương.
Nhóm phía Tây (Nahali-Munda)
(A) Tây: Nahali (?)
(B) Đông: Munda
(a) Phía Bắc: Kherwari (Santali, Mundari, Korwa, v.v.), Kurku
(b) Phía Nam:
1. Trung tâm: Kharia, Juang
2. Đông Nam: Sora, Pareng, Gutob, Remo
Nhóm phía Đông (Khmer-Nicobar)
(A) Phía Tây: Nicobar (Nancowry, Car, v.v.)
(B) Phía Đông: Palaung-Khmer
(a) Tây: Khasi
(b) Bắc: Palaung-Wa (Palaung, Wa, Riang, Lawa, v.v.)
(c) Đông: Mon-Khmer (Mon, Khmer, Bahnar, Sre, v.v.)
(d) Nam: Malacca
1. Sakai
2. Jakud
3. Semang
Tuy nhiên, cách tiếp cận của Pinnow mang tính loại hình hơn là lịch sử, và ông thận trọng rằng nhóm phía Đông (Khmer-Nicobar) có thể không phải là một đơn vị phát sinh loài duy nhất đối lập với Munda. Sự thận trọng này dường như bị bỏ qua trong các nghiên cứu sau, dẫn đến việc mô hình của Pinnow được chấp nhận rộng rãi.
Trong thập niên tiếp theo, bài viết trong Encyclopaedia Britannica của Diffloth (1974) trở nên đặc biệt có ảnh hưởng. Diffloth trình bày mô hình Pinnow đã sửa đổi với ba phân họ tọa độ: Munda, Nicobarese, và Mon-Khmer. Phân họ Mon-Khmer được chia nhỏ hơn dựa trên các nghiên cứu thống kê từ vựng của Thomas và Headley (1970). Sau đó (1979, 1999), Diffloth hợp nhất Nicobarese vào Mon-Khmer như một nhóm chị em của Aslian, và gần đây (2005) đề xuất Khasi-Palaungic-Khmuic như một phân họ tọa độ thứ ba “mới”.
Các phân loại này ngụ ý rằng Munda có mức đa dạng lịch sử tương đương với phần còn lại của AA, do đó trung tâm địa lý của sự đa dạng có thể không nằm ở Đông Nam Á mà ở phía tây. Hiện tại, không thể đánh giá các phân loại của Diffloth do ông chưa công bố dữ liệu và lập luận. Tuy nhiên, có thể xem xét khía cạnh nổi bật nhất: liệu việc xem Munda là một nhánh chính, chỉ tọa độ với một hoặc hai nhánh chính khác, có hợp lý hay không.
Munda: Hình thái cổ hay đổi mới?
Trong AA, các ngôn ngữ Munda có tính tổng hợp cao, sử dụng hậu tố rộng rãi. Pinnow (1963) mô tả các đặc điểm này là cổ xưa:
> … các ngôn ngữ Munda chắc chắn giống proto-Austroasiatic hơn các thành viên khác trong ngữ hệ. Về hình thái, chúng bảo thủ hơn nhiều so với Nicobarese và Khasi, và về từ vựng, chúng vượt trội hơn các ngôn ngữ Mon-Khmer trong việc bảo tồn các gốc và hình thức từ cổ xưa. (Pinnow 1963, 150)
Đánh giá này có ý nghĩa quan trọng đối với vấn đề quê hương. Nếu Munda bảo thủ hơn, điều này ngụ ý rằng các ngôn ngữ Mon-Khmer đã trải qua một quá trình tái cấu trúc kiểu hình, loại bỏ hậu tố – một thay đổi lớn đến mức khó xảy ra nhiều lần. Do đó, Mon-Khmer có thể bắt nguồn từ một nút phân nhánh duy nhất trong cây AA, cho thấy tổ tiên Mon-Khmer di cư về phía đông, đơn giản hóa hình thái, đến mức các ngôn ngữ như tiếng Việt loại bỏ hoàn toàn dấu vết tiền tố lịch sử, chuyển mọi thứ thành âm tiết đơn.
Quan điểm này được một số học giả ủng hộ. Van Driem (2001, 299) tự tin chỉ trích Reid (1994), người cố gắng khôi phục giả thuyết “Austric” bằng cách so sánh Nicobarese với Nam Đảo, vì không sử dụng “các ngôn ngữ Munda bảo thủ hơn về ngữ pháp”. Van Driem còn gợi ý rằng sự xâm nhập của người Tạng-Miến vào Bengal đã kích hoạt sự phân tán ban đầu của AA về phía tây và đông, để lại khoảng trống trong phân bố AA tại khu vực này.
Tuy nhiên, không nhất thiết phải kết luận rằng lịch sử Mon-Khmer là một chuỗi mất mát hình thái. Từ những năm 1980, Patricia Donegan và David Stampe đã lập luận rằng Mon-Khmer có thể gần với proto-AA hơn về cấu trúc, với quá trình tái cấu trúc từ kiểu cô lập sang tổng hợp. Lập luận tập trung vào trọng âm cụm từ: Munda có trọng âm giảm (trochaic), trong khi Mon-Khmer có trọng âm tăng (iambic). Điều này quan trọng vì các mô hình trọng âm ảnh hưởng đáng kể đến cấu trúc ngôn ngữ theo thời gian, đặc biệt trong sự phân bố của clitics và phụ tố.
Trong các ngôn ngữ có trọng âm giảm, các hình thái sau âm tiết chính có xu hướng bị giảm ngữ âm và ngữ pháp hóa thành hậu tố. Ngược lại, trong các ngôn ngữ có trọng âm tăng, các hình thái trước âm tiết chính dễ trở thành tiền tố. Điều này cho phép tái dựng hướng thay đổi dựa trên kiểu hình. Donegan (1993) đã nhấn mạnh:
> Tiếng Mon-Khmer không có biến tố hay hậu tố, và proto-AA cũng vậy, nhưng tiếng Munda lại có rất nhiều biến tố và hậu tố. […] Lưu ý đến hình thái động từ biến tố và phái sinh phức tạp, phần lớn là hậu tố. Pinnow […] cung cấp từ nguyên cho nhiều hậu tố này. Một số được tái dựng là hậu tố của proto-Munda, tức là chúng phát triển trong các ngôn ngữ riêng lẻ. (Donegan 1993, 341)
Stampe (2004) giải thích tại Hội nghị SEALS 2004 ở Bangkok:
> Chỉ Pinnow (1960) và Zide & Anderson (2001) dường như chia sẻ quan điểm này. Lập luận của Pinnow dựa trên bằng chứng về hậu tố hóa thạch trong tiếng Khmer, nhưng không được hỗ trợ bởi nghiên cứu toàn diện về hình thái Khmer của Jenner và Pou (1980-1981). Jacob (1992) chỉ ra rằng các thay đổi mà Pinnow trích dẫn là biểu cảm, không phải ngữ pháp. Lập luận của Zide & Anderson gồm hai phần: (1) sự xuất hiện của đại từ tân ngữ enclitic và hiếm hoi là danh từ trong Nicobarese và một số ngôn ngữ Mon-Khmer; (2) tái dựng động từ proto-Munda, nhưng họ không có bằng chứng cụ thể rằng chúng điển hình cho AA, ngụ ý rằng mọi dấu vết đã mất trong Mon-Khmer. (Stampe 2004, 4)
Donegan & Stampe (2004, 6) so sánh hình thái động từ Munda với trật tự từ trong mệnh đề Mon-Khmer, ví dụ:
Sora: (aniti) ad-msl-tiy-dar-iji-da-e
anh ấy không muốn cho tôi cơm -aux -3pr
Khmer: kdat ʔatcag ʔaoy baay kpom
Ở đây, có sự tương ứng hoàn chỉnh giữa các hình thái chức năng, dù chỉ một hình thái có cùng nguồn gốc (Sora ad- : Khmer ʔat). Trật tự từ VO của Mon-Khmer được bảo tồn trong Sora dưới dạng hình thái ràng buộc, trong khi trật tự OV chiếm ưu thế ở cấp độ mệnh đề.
Tôi đề xuất rằng AA đã duy trì trọng âm cụm từ tăng trong thời gian dài trước giai đoạn proto-AA và sự phân rã của ngữ hệ. Quan trọng là, trong khi chỉ Munda có hậu tố rộng rãi, cả Munda và Mon-Khmer đều có tiền tố và trung tố, và như Anderson (2004) chỉ ra, các tiền tố/trung tố này là đồng nhất và có thể tái dựng cho giai đoạn sớm.
Dựa trên kiểu hình, có thể suy ra rằng trung tố AA bắt nguồn từ các tiền tố metathesized. Cụ thể, trung tố -m- và -n- có thể xuất phát từ các phụ âm đầu b, d, hiếm gặp dưới dạng tiền tố nhưng phổ biến trong proto-AA (xem Shorto 2006). Proto-AA hẳn đã duy trì trọng âm tăng đủ lâu để phát triển cả tiền tố và trung tố. Sự chuyển sang trọng âm giảm trong tiền Munda kích hoạt sự gia tăng hậu tố, nhưng các tiền tố và trung tố AA vẫn được bảo tồn. Điều này ngụ ý sự ưu thế lịch sử của trọng âm tăng.
Vấn đề trọng âm cũng giải thích cấu trúc gốc Munda, cần điều hòa giữa các âm tiết đơn và âm tiết đôi trochaic của Munda với âm tiết đơn và âm tiết đôi iambic của Mon-Khmer.
Trước hết, một tỷ lệ gốc từ luôn là đơn âm tiết và không cần giải thích đặc biệt. Các ngôn ngữ Mon-Khmer như tiếng Việt (Ferlus 1998), Nyaheun (Sidwell & Jacq 2003), và U (Svantesson 1988) đã giảm các gốc sesquisyllabic thành đơn âm tiết. Vấn đề nằm ở khoảng một nửa từ vựng trong các ngôn ngữ Mon-Khmer bảo thủ, vốn là sesquisyllabic. Shorto (2006) tái dựng một canon gốc sesquisyllabic (C)CV(:)C, có thể áp dụng cho proto-AA.
Theo Donegan và Stampe, cạnh phải của từ ngữ âm vị thể hiện cấu trúc âm vị và hình thái giảm. Vị trí coda trong AA không có tương phản về thời gian thoát hơi (VOT): trong Mon-Khmer, các âm tắc vô thanh không giải phóng kết hợp với thanh quản yếu; trong Munda, các âm tắc hữu thanh kết hợp với thanh quản mạnh. Cả hai đều là chuỗi duy nhất, không có tương phản thanh điệu, phù hợp với lý thuyết.
Ngoài ra, Mon-Khmer thường có tương phản độ dài nguyên âm, trong khi điều này hiếm ở Munda. Trong các từ sesquisyllabic của Mon-Khmer, âm tiết chính mang 2 mora, còn âm tiết đầu không có trọng số nhịp điệu và nguyên âm không có giá trị ngữ âm. Do âm tiết chính mang 2 mora, Mon-Khmer có xu hướng phát triển âm đôi và thanh điệu phân tách. Ngược lại, kho nguyên âm Munda nhỏ, ít giữ được sự phân biệt độ dài cũ.
Tôi cho rằng trong giai đoạn tiền Munda, trọng âm cụm từ được chuyển lên phía trước, và người nói bắt đầu gán nhịp điệu cho âm tiết đầu (sao chép hoặc tăng cường nhãn đơn âm), lấy một mora từ âm tiết chính và chuyển sang âm tiết đầu mới. Khi âm tiết chính giảm còn một mora, động lực cấu trúc cho độ dài nguyên âm hoặc âm đôi giảm. Dấu vết của quá trình này được thấy qua các từ nguyên gợi ý nguyên âm dài proto-AA, ví dụ (dữ liệu từ Shorto 2006):
Nguyên âm dài proto-AA vang vọng
– bluuʔ ‘đùi’
– Khmer: phlar, Bahnar: blu:, Palaung: blu, Nicobar: pula:, Temiar: baloʔ
– Munda: Mundari: bulu, Ho: bulu, Kurku: bulu, Kharia: bhulu, Sora: bulu:-n
– jliip ‘dài’
– Khmer cổ: ʔleip, Mon cổ: caliq, Nicobar: jlm
– Munda: Mundari: jilip, Bhirhor: pliq
– kluuʔ ‘rùa’
– Mon: klao, Bahnar: bla:ŋ
– Munda: Sora: ku(:)lu:, Kharia: kulu
– briiʔ ‘rừng’
– Bahnar: bri:, Praok: praj, Jah Hut: bariʔ, Khmer cổ: vrai
– Munda: Kharia: biru, Mundari: bir, Bhirhor: bir, Ho: bir
– rk[aw]ʔ ‘gạo lức’
– Khmer: ʔaŋka:, Palaung: rako, Việt: gạo, Nyahkur: pka:ʔ
– Munda: Kharia: raʔkut, Sora: ruʔku:, Ho: ru:, Gutob: ru:
– jhaam ‘máu’
– Khmer: chi:am, Bahnar: pha:m, Nicobar: maha:m, Kammu-Yuan: mha:m
– Munda: Sora: mipaʔm, Kharia: jham, Santali: jham, Mundari: jham
– kjaal ‘không khí, gió’
– Mon cổ: kyal, Bahnar: kja:l, Khmer: khjal, Kuy: kja:l
– Munda: Kharia: kjal, Sora: jojo, Santali: khao, Mundari: khao
– kmuʔ ‘bẩn’
– Khmer: kmau, Bahnar: kmau, Palaung: kmo
– Munda: Mundari: kumu, Ho: homu, Kurku: kumu
– l[ə]m ‘bóng, linh hồn’
– Khmer: mlup, Bahnar: pahpa:l
– Munda: Sora: lum, Santali: umul, Mundari: umbul
Nguyên âm ngắn proto-AA – âm tiết đầu mới có thể thay đổi/có điều kiện
– kraʔ ‘đường’
– Kuy: kro:, Praok: kra, Mường: kha
– Munda: Santali: kara, Mundari: kara, Kurku: kara
– klaʔ ‘hổ’
– Bahnar: kla:, Mon cổ: kla(ʔ), Khmer: khla:, Việt: khái
– Munda: Santali: kula, Mundari: kula ~ kola, Sora: kula ~ kola
– [hj]maʔ ‘tên’
– Mon cổ: hma, Semai: hma, Khmer cổ: jmah
– Munda: Kharia: jimi ~ pimi, Mundari: num ~ nutum, Sora: jumu ~ jimu
– tmaʔ ‘mới’
– Bahnar: tmaʔ, Khmer: thməy, Việt: mới
– Munda: Kharia: tanm, Sora: thum, Santali: khaŋkaŋ
– kn[i]ʔ ‘chuột’
– Mon cổ: kan(ʔ), Bahnar: kna:, Kammu-Yuan: kniʔ, Khasi: khnai
– Munda: Kharia: kini, Mundari: sina, Sora: kini
Lặp lại toàn bộ hoặc một phần gốc đơn âm tiết
– ɓaʔ ‘thóc’ ([ka]ɓa:ʔ theo Diffloth 2005)
– Bahnar: ɓa:m, Khasi: kba, Ho: ba
– Munda: Kharia: ɓaʔ, Mundari: baha, Sora: baha:, Kurku: ba
– [b]tai ‘đầu’
– Khmer: buk, Bahnar: bo:k
– Munda: Kharia: ɓaʔ ~ laʔb, Sora: baŋ, Santali: boʔ ~ baʔ
Gốc đơn âm tiết với nguyên âm ngắn có phản xạ đơn giản
– cak ‘cắn’
– Khmer: cak, Kensiu: cak, Khasi: cap, Nicobar: cap
– Munda: Sora: kaci, Santali: haʔb, Mundari: haʔb, Kurku: haʔb
– mat ‘mắt’
– Khmer: mat, Kensiu: mat, Khasi: mat, Nicobar: mat
– Munda: Sora: maʔod, Kharia: maʔ, Mundari: maʔd, Kurku: maʔ
– tah ‘vú’
– Bahnar: tah, Khmer: tah, Nicobar: teh
– Munda: Santali: toa, Bhirhor: toa, Mundari: toa
Từ nguyên với phản xạ phương Đông và Munda có biến thể ngắn/dài
– ja[a]q ‘chân’
– Mon cổ: jaŋ, Palaung: jaŋ, Bahnar: jaq, Khmer: [cɨəŋ]
– Munda: Kharia: guju, Sora: jəe:, Mundari: jaga, Kurku: jaga
Những ví dụ này cho thấy gốc Munda có thể bắt nguồn từ gốc sesquisyllabic proto-AA, phù hợp với tái dựng của Shorto (2006). Do đó, không thể xem Mon-Khmer như một nhóm phụ đối lập với Munda. Thay vào đó, chúng là những di tích duy trì nhịp điệu cụm từ tăng của AA, với các thay đổi cục bộ. Không có cơ sở cấu trúc để cho rằng Munda “giống proto-AA hơn”, buộc chúng ta chuyển sang các phương pháp khác.
Phát sinh ngôn ngữ: Tái tạo ngữ âm
Để phân loại một ngữ hệ, đặc biệt là ngữ hệ cô lập về cấu trúc, tái tạo ngữ âm xác định các đổi mới nhánh là tiêu chuẩn vàng. Với AA, chưa có tái tạo toàn diện, chỉ có các nghiên cứu nhánh riêng lẻ và nỗ lực của Shorto (2006), không bao gồm Munda (xem Sidwell, đang in, để đánh giá toàn diện). Tái tạo nguyên âm proto-AA gặp nhiều khó khăn, với kết quả tích lũy chậm. Tuy nhiên, hệ thống phụ âm proto-AA đã được hiểu rõ trong một thế kỷ, phần lớn nhờ Wilhelm Schmidt (1905, 1906). Hệ thống phụ âm cơ bản được bảo tồn trong các ngôn ngữ Mon-Khmer bảo thủ (như Katu) và các văn khắc Mon, Khmer trước khi mất giọng và tái cấu trúc, giải thích đầy đủ các phụ âm proto-AA mà không cần giả định thêm phân đoạn hoặc kiểu phát âm.
Bảng 1 trình bày sự tương ứng phụ âm đầu/trước nguyên âm và âm xát giữa các nhánh AA, là mô hình làm việc của tôi tại thời điểm viết. Bảng so sánh các âm tắc miệng tái dựng cho mỗi nhánh và proto-Mon-Khmer (tương đương proto-AA) từ Shorto (2006). Các hợp nhất phụ âm được đánh dấu; các phân tách cũng được ghi nhận, dù chưa xác định yếu tố điều kiện. Bảng này có thể so sánh với các tương ứng của Shorto (2006, 52-54).
Sự thay đổi phổ biến nhất là hợp nhất giữa âm tắc hữu thanh và âm nổ, xảy ra ở sáu trong mười hai nhánh. Đây là thay đổi tầm thường, phân bố rộng, không gợi ý nhóm phụ, ngay cả giữa các nhánh lân cận. Ví dụ, nó xảy ra ở Pearic và Khmer, nhưng Pearic có thêm thay đổi (một phần?) thành âm khát vọng ở các âm tắc vô thanh.
Sự mất giọng ở phụ âm đầu, liên quan chặt chẽ đến tái cấu trúc nguyên âm, không rõ ràng. Tương phản giọng có thể tái dựng cho mọi nhánh, và các tái cấu trúc này diễn ra độc lập sau khi các nhánh đa dạng hóa nội bộ. Do đó, không có mô hình phân tách hay hợp nhất nào gợi ý phân nhánh lồng nhau – lịch sử ngữ âm của các nhánh dường như độc lập. Điều này buộc chúng ta tìm các chỉ dẫn phân nhóm phụ trong từ vựng.
Bảng 1: Tương ứng ngữ âm cho âm tắc miệng đầu/trước nguyên âm giữa các nhánh AA (proto-Mon-Khmer từ Shorto 2006, proto-Munda từ Pinnow, các tái dựng nhánh khác từ Sidwell; mô hình hoạt động ngày 1/2/2010).
| PMK | Munda | Khasi | Palaungic | Khmuic | Việt | Katuic | Bahnaric | Pearic | Pre-Khmer | Old Mon | Aslian | Nicobaric |
|–|-|-|–|–||–|-|–|–||–|–|
| p- | p- | ph- | p- | p- | p- | p- | p- | ph- p- | p- | p- | p- | f- |
| b- | b- | p- | b- | b- | b- | b- | b- | b- | b- | b- | b- | p- |
| ɓ- | ɓ- | ɓ- | ɓ- | ɓ- | ɓ- | ɓ- | ɓ- | ɓ- | ɓ- | ɓ- | ɓ- | p- (-ʔ) |
| t- | t- | | t- | t- | | t- | t- | | t- | | | |
| d- | d- | d- | d- | d- | d- | d- | d- | d- | d- | d- | d- | |
| ɗ- | ɗ- | ɗ- | ɗ- | ɗ- | ɗ- | ɗ- | ɗ- | ɗ- | ɗ- | d- | ɗ- | ɗ- |
| h- | ɦ- (Ø-~h-)| h- | h- | h- | h- | h- | h- | h- | h- | h- | h- | h- |
| s- | s- | s- | s- | s- | s- | s- | s- | s- | s- | s- | s- | h- |
| c- | s- | s- | c- | c- | c- | c- | c- | ch- | c- | c- | c- | s- |
| ɟ- | ɟ- | ɟ- | ɟ- | ɟ- | | ɟ- | ɟ- | ɟ- | ɟ- | ɟ- | ɟ- | c- |
| k- | q- k-| kh- | k- | k- | k- | k- | k- | kh- k- | k- | k- | k- | k- |
| g- | g- | k- | g- | g- | g- | g- | g- | g- | g- | g- | g- | k- |
Thống kê từ vựng
Ngôn ngữ học Đông Nam Á thường sử dụng thống kê từ vựng như một công cụ khám phá, mở đường cho tái cấu trúc so sánh. AA đã là đối tượng của nhiều phân tích thống kê từ vựng, với nghiên cứu gần nhất và toàn diện nhất là Peiros (2004, tiếng Nga), sử dụng dữ liệu từ hơn 100 ngôn ngữ. Peiros áp dụng phương pháp niên đại thanh môn của Starostin, vốn gây tranh cãi. Phân loại AA của ông được tái hiện tại Hình 5, đề xuất một cấu trúc phân nhánh lồng nhau phức tạp, tương tự Pinnow (1960) và Diffloth (1974) ở chỗ bao gồm các nhánh cao nhất là Nicobarese, Munda, và Mon-Khmer (dù quan hệ hơi khác).
Tôi đã tái hiện nghiên cứu này với tập dữ liệu nhỏ hơn, gồm 36 ngôn ngữ, tập trung vào các ngôn ngữ có tương ứng âm thanh và lịch sử tiếp xúc được ghi chép rõ ràng. Tập dữ liệu, bài tập, và bình luận được công khai tại http://people.anu.edu.au/~u9907217. Ma trận tại Hình 7 được tạo bằng Glotpc.exe (Jacques Guy thiết kế, tải miễn phí tại http://sil.org). Kết quả khác đáng kể so với Peiros – tôi cho rằng ông đã đánh giá thấp các từ mượn giữa các nhánh (đặc biệt từ Mon và Khmer sang các ngôn ngữ lân cận) và đặt quá nhiều trọng số vào các tỷ lệ đồng nguyên thấp (như Nicobar), nơi sự cô lập và yếu tố xã hội ảnh hưởng đến tốc độ thay đổi từ vựng. Do đó, tôi đề xuất một cây phẳng hơn, vì các tín hiệu từ vựng quá phức tạp để hỗ trợ phân nhánh lồng nhau, chỉ phù hợp với một cây đơn giản dạng “cái cào”.
Đáng chú ý, ma trận của tôi tương đồng đáng kể với ma trận của Frank Huffman (1978), tái hiện tại Hình 6. Dù mật độ đồng nguyên tổng thể của tôi thấp hơn, cấu trúc tương tự. Cả Huffman và tôi đều ghi nhận tỷ lệ liên nhánh cao nhất giữa Katuic và Bahnaric, với xu hướng các nhánh khác có tỷ lệ đồng nguyên cao hơn với Katuic-Bahnaric so với các nhánh khác, giảm dần khi khoảng cách địa lý tăng. Logic cho thấy khó biểu diễn các mối quan hệ này dưới dạng phân nhánh lồng nhau.
Biểu đồ 1: Tỷ lệ phần trăm và trung bình của các nhánh đồng nguyên
| | KB | Khmer | Mon | Palaung | Viet-Muong | Pear | Aslian | Khmuic | Khasi | Munda | Nicobar |
|-|–|-|–||||–|–|-|-||
| Katuic-Bahnaric | | 47 | 42 | 34 | 33 | 35 | 30 | 32 | 24 | 27 | 20 |
| Khmer | 47 | | 33 | 31 | 30 | 39 | 28 | 25 | 24 | 24 | 23 |
| Mon | 42 | 33 | | 33 | 30 | 22 | 24 | 28 | 22 | 20 | 19 |
| Palaung | 34 | 31 | 33 | | 26 | 25 | 22 | 26 | 26 | 18 | 23 |
| Viet-Muong | 33 | 30 | 30 | 26 | | 24 | 22 | 24 | 23 | 20 | 18 |
| Pear | 35 | 39 | 22 | 25 | 24 | | 24 | 22 | 17 | 19 | 16 |
| Aslian | 30 | 28 | 24 | 22 | 22 | 24 | | 24 | 20 | 17 | 19 |
| Khmuic | 32 | 25 | 28 | 26 | 24 | 22 | 24 | | 24 | 20 | 17 |
| Khasi | 24 | 24 | 22 | 26 | 25 | 17 | 20 | 24 | | 18 | 14 |
| Munda | 27 | 24 | 20 | 18 | 20 | 19 | 17 | 20 | 18 | | 17 |
| Nicobar | 20 | 23 | 19 | 23 | 18 | 16 | 19 | 17 | 14 | 17 | |
| Tổng liên nhánh | 324 | 504 | 275 | 264 | 250 | 243 | 231 | 222 | 212 | 200 | 186 |
| Trung bình liên nhánh | 32.4 | 50.4 | 27.5 | 26.4 | 25.0 | 24.3 | 23.1 | 22.2 | 21.2 | 20.0 | 18.6 |
Hình 6: Ma trận thống kê từ vựng AA của Huffman (1978)
Trong nghiên cứu của Huffman, các giá trị trung bình liên nhánh làm rõ hiệu ứng. Trong ma trận của tôi, các ngôn ngữ riêng lẻ được phân biệt, và một mô hình tiềm năng được ghi nhận: tỷ lệ đồng nguyên cao hơn với Katuic-Bahnaric giảm dần trong phạm vi, không chỉ giữa các nhánh. Ví dụ, trong Palaungic, Danaw có điểm thấp hơn; trong Aslian, Jahai thấp hơn; trong Khmuic, Mal rất cao, Khmu’ trung bình, và Mlabri rất thấp. Trong Khasi, Wa có điểm cao hơn đáng kể so với Khasi chuẩn hoặc Pnar. Những biến thể này dường như không áp dụng cho Munda và Nicobarese.
Làm thế nào để giải thích các mô hình này? Có thể dữ liệu của các ngôn ngữ riêng lẻ bao gồm các trường hợp thay thế từ vựng nhanh hơn, làm phức tạp bức tranh. Tuy nhiên, mối tương quan địa lý rõ ràng: ngôn ngữ hoặc nhánh càng gần Katuic hoặc Bahnaric, tỷ lệ đồng nguyên với Katuic/Bahnaric càng cao. Tôi chưa xác định được đổi mới chung để nhóm Katuic-Bahnaric, do đó cho rằng đây là kết quả của tiếp xúc kéo dài, tập trung tại trung lưu sông Mê Kông. Các nhánh xa khu vực này (như Palaungic, Aslian) ít bị ảnh hưởng, và một số (như Mangic, Nicobarese) đã tiếp xúc với các ngữ hệ hoặc điều kiện xã hội khác, dẫn đến thay đổi từ vựng nhanh hơn.
Huffman (1978, 5) đề xuất:
> Điều này dường như cho thấy một trung tâm phân tán ở phía đông (Trung Việt Nam) và một cuộc di cư riêng biệt về phía tây cho mỗi nhánh của AA.
Ý tưởng là các nhánh, khi còn là ngôn ngữ thống nhất, tách khỏi vùng trung tâm vào các thời điểm khác nhau, không để lại dấu hiệu phân nhóm giữa các nhánh ngoại vi. Trong vùng trung tâm, sự phân hóa diễn ra dưới ảnh hưởng của tiếp xúc. “Chuyển động ít nhất” cần thiết để giải thích phân bố AA là một bức xạ đơn giản, thay vì cây lồng nhau với nhiều nút. Điều này phù hợp với Lý thuyết Di cư.
Không có phân tích chi tiết về đổi mới từ vựng AA, đây là kết luận từ bằng chứng hiện có. Thống kê từ vựng cung cấp cái nhìn tổng quát về đa dạng từ vựng của AA và các nhánh. Về từ vựng cơ bản, không thể nói Munda đa dạng hơn Khmuic, Aslian, hay Mangic. Dù một số nhánh như Khmer và Monic khá nhỏ, không có dữ liệu cho thấy nhánh lớn nào “cũ” hơn nhánh khác. Do đó, chúng ta chỉ có một cây phân nhánh yếu hoặc bức xạ dạng “cái cào”.
Hình 7: Ma trận thống kê từ vựng AA do Sidwell biên soạn (1/2/2010). Các nhánh được đóng khung, tỷ lệ cao bất thường được tô bóng.
Kết luận
Ba hướng nghiên cứu độc lập – hình thái, ngữ âm, và từ vựng – không cung cấp bằng chứng rõ ràng cho các nhóm phụ lồng nhau trong AA. Dữ liệu từ vựng chỉ ra một vùng tiếp xúc tập trung quanh Katuic và Bahnaric. Cho đến khi có bằng chứng mới, giả thuyết hợp lý nhất là sự lan tỏa đơn giản từ thung lũng sông Mê Kông.
Harry Shorto, dù nghiêng về nguồn gốc sông Dương Tử, đã đấu tranh để dung hòa điều này với hiểu biết về Mon và Khmer, và kết luận tương tự:
> Người Mon-Khmer và Khasi phương Bắc có thể đã theo tuyến thương mại từ Trung Quốc đến Ấn Độ, như người Munda có thể đã làm trước họ. Nhưng không có lý do chính đáng để truy nguyên các tuyến của người Mon, Khmer, và các nhóm chiếm đồng bằng sông từ vùng đất phía sau thay vì ngược lên từ bờ biển. (Shorto 1979, 278)
Tài liệu tham khảo
1. Anderson, G.D.S. 2006. Advances in Proto-Munda reconstruction. Journal of Mon-Khmer Studies, 34:159-184.
2. Blench, R. 2008. Stratigraphy in the peopling of China: How far do linguistic evidence match genetics and archaeology? In Human Migration in Mainland East Asia and Taiwan, 105-132. London: Routledge.
3. Chazée, L. 1999. The Peoples of Laos: Rural and Ethnic Diversities. Bangkok: White Lotus.
4. Diebold, A.R. 1960. Determining the centers of dispersal of language groups. International Journal of American Linguistics, 26:1-10.
5. Diffloth, G. 1974. Austroasiatic languages. Encyclopaedia Britannica. Chicago/London/Toronto/Geneva: Encyclopaedia Britannica Inc., 480-484.
6. Diffloth, G. 1979. Aslian languages and Southeast Asian prehistory. Federation Museums Journal, 24:3-16.
7. Diffloth, G. 1999. Austroasiatic classification. In Chazée, L. The Peoples of Laos: Rural and Ethnic Diversities. Bangkok: White Lotus.
8. Diffloth, G. 2005. The contribution of linguistic palaeontology to the homeland of Austroasiatic. In The Peopling of East Asia, 79-82. Routledge/Curzon.
9. Donegan, P. & Stampe, D. 1983. Rhythm and the holistic organization of language structure. In Chicago Linguistic Society Papers from the Parasession on the Interplay of Phonology, Morphology, and Syntax, 335-353.
10. Donegan, P. & Stampe, D. 2004. Rhythm and the synthetic drift of Munda. Yearbook of South Asian Languages and Linguistics, 3-36. Berlin/New York: De Gruyter.
11. Donegan, P. 1993. Rhythm and vowel drift in Munda and Mon-Khmer. Linguistics of the Tibeto-Burman Area, 16(1):1-43.
12. Dyen, I. 1956. Language distribution and migration theory. Language, 32(4):611-626. (Reprinted in Linguistic Subgrouping and Lexicostatistics. The Hague: Mouton, 50-74.)
13. Ferlus, M. 1998. Les systèmes de tons dans les langues Viet-Muong. Diachronica, 15(1):1-27.
14. Grierson, G.A. 1904. Mon-Khmer and Siamese-Chinese Families. Linguistic Survey of India, Vol. II. Delhi.
15. Huffman, F.E. 1978. On the centrality of Katuic-Bahnaric to Austroasiatic. Unpublished handout, 3rd ICAAL Meeting, Mysore.
16. Jacob, J. 1989-1990. Some comments on the relationship between Khmer words with identical vowel nuclei and final consonants. Journal of Mon-Khmer Studies, 18-19:67-76.
17. Jenner, P. & Pou, S. 1980-81. A morphological dictionary of Khmer. Mon-Khmer Studies, 9-10.
18. Kuiper, F.B.J. 1955. Rigvedic loanwords. In Studia Indologica, ed. Spies. Bonn.
19. Kuiper, F.B.J. 1967. The genesis of a linguistic area. Indo-Iranian Journal, 10:81-102.
20. Kuiper, F.B.J. 1991. Aryans in the Rigveda. Rodopi.
21. Mei, T.-L. & Norman, J. 1976. The Austroasiatics in ancient South China: Some lexical evidence. Monumenta Serica, 22:274-301.
22. Peiros, I. & Shnirelman, V. 1998. Rice in Southeast Asia: A regional interdisciplinary approach. In Archaeology and Language II, 379-389. London: Routledge.
23. Peiros, I. 2004. Geneticeskaja klassifikacija avstroaziatskix jazykov. Moskva: Rossijskij gosudarstvennyj gumanitarnyj universitet (dissertacija).
24. Peiros, I. 1989. Dopolnenie k gipoteze SA Starostina o rodstve nostraticheskix i sinokavkazskix jazykov. In Lingvisticheskaja rekonstrukcija i drevnejshaja istorija vostoka, Part 1. Moskva: Nauka.
25. Peiros, I. 1998. Comparative Linguistics in Southeast Asia. Pacific Linguistics Series C-142. Canberra.
26. Pinnow, H.-J. 1960. Über der Ursprung der voneinander abweichenden Strukturen der Munda- und Khmer-Nikobar-Sprachen. Indo-Iranian Journal, 4:81-103.
27. Pinnow, H.-J. 1963. The position of the Munda languages within the Austroasiatic language family. In Linguistic Comparison in Southeast Asia and the Pacific, ed. H.L. Shorto, 140-152. London: SOAS.
28. Reid, L.A. 1994. Morphological evidence for Austric. Oceanic Linguistics, 33(2):323-344.
29. Sapir, E. 1916. Time Perspective in Aboriginal American Culture, A Study in Method. Ottawa: Government Printing Bureau.
30. Schmidt, W. 1905. Grundzüge der Phonetik des Khasi in Beziehung zu den Mon-Khmer-Sprachen. Bayerische Akademie der Wissenschaften, 1(22.3):677-810.
31. Schmidt, W. 1906. Die Mon-Khmer-Völker, ein Bindeglied zwischen Völkern Zentralasiens und Austronesiens. Archiv für Anthropologie, 5:59-109.
32. Schuessler, A. 2007. ABC Etymological Dictionary of Old Chinese. University of Hawaii Press.
33. Shorto, H.L. 1979. The linguistic prehistory of mainland Southeast Asia. In Early Southeast Asia, 273-278. New York/Kuala Lumpur: Oxford University Press.
34. Shorto, H.L. 2006. A Mon-Khmer Comparative Dictionary. Canberra: Pacific Linguistics 579.
35. Sidwell, P. & Jacq, P. 2003. A Handbook of Comparative Bahnaric: Vol. 1, West Bahnaric. Canberra: Pacific Linguistics 551.
36. Sidwell, P. 2009. Classifying the Austroasiatic Languages: History and State of the Art. Munich: Lincom Europa.
37. Stampe, D. 2004. Is Proto-Austroasiatic Munda-like or Mon-Khmer-like? Conference handout, 14th Meeting of the Southeast Asian Linguistics Society, Bangkok, May 2004.
38. Svantesson, J.-O. 1988. U. Linguistics of the Tibeto-Burman Area, 11(1):64-133.
39. van Driem, G. 2001. Languages of the Himalayas, Vol. 1. Leiden: Brill.
40. Witzel, M. 1999. Substrate languages in Old Indo-Aryan (Rigvedic, Middle and Late Vedic). Electronic Journal of Vedic Studies, 5(1). http://www.ejvs.laurasianacademy.com/ejvs0501/ejvs0501article.pdf
41. Zide, N.H. & Anderson, G.D.S. 2001. Recent advances in the reconstruction of Proto-Munda verbs (Austroasiatic). In Historical Linguistics 1999, 13-30. Amsterdam: John Benjamins.
Tóm tắt tiếng Nga (dịch nguyên văn từ bản gốc)
Статья посвящена вопросам прародины и последующего расселения австроазиатских языков. Традиционный «интуитивистский» подход пока не позволяет убедительно классифицировать более мелкие языковые подгруппы внутри уже установленных ветвей этой лингвистической семьи. При этом лексический анализ словарного состава анализируемых языков указывает на наличие длительных контактов и, возможно, случаев языковой конвергенции на территории Юго-Восточной Азии. По мнению автора, это указывает если не на исключительность, то, по крайней мере, на существенную древность присутствия австроазиатских языков в Индокитае (с возможным расселением, расположенным в бассейне р. Меконг). Наиболее географически удалённая ветвь австроазиатской семьи — языки Мунда в Индии — демонстрирует исключительно высокое число инноваций. В соответствии с этой гипотезой в статье реконструируется эволюция корневой структуры языков Мунда.
Ghi chú
– Nội dung được giữ nguyên từng từ, chỉ thay thế các thuật ngữ không chính xác bằng từ ngữ chuyên môn phù hợp (e.g., “Nam Á” thành “Ngữ hệ Nam Á” hoặc “Austroasiatic”; “Munnda” thành “Munda”; “từ điển” thành “từ vựng”).