Phan Huy Khánh

Main Article Content

Abstract

In the research of natural language processing (NLP), one must always
accumulate and update of more from many of lexical data resources of
heterogeneous formats for various applications. These resources are often difficult
to maintain and to manipulate. It is necessary reconstructing a specific dictionary
for every new application. Following the methods of analysis and design of the
information systems, it is necessary to create a data conceptual model and then
convert it in a data logical model in order to construct a lexical data base. Currently
in Vietnam, there are already some Vietnamise dictionaries on computer, but it
doesn't exist more dialectal dictionary.
We present in this paper a solution of constructing of data models in order to
create a Nghe-Tinh dialectal dictionary. We construct an entity-association model
to represent the relationshif between the entry (headword), explanation, popular
meaning, phrase et sentence from a publish paper Nghe-Tinh dialectal dictionary.
This model is convert into WinWord document format to update the Nghe-Tinh
dialectal lexical database in the pivot telex code. By using an open sources of a
software system of consulting the multiligual lexical database developed by us at
the University of Danang, we have build a first version of Nghe-Tinh dialectal
dictionary on computer. The lexical resource of this dictionary contains about 5000
entries with the possibility of update and readable. In the same time, the entity-
association model is also converted into Access MDB table and XML format.

References

1. Nguvền Nhã Bản, Phan Mậu Cảnh, Hoàng Trọng Canh, Nguyền Hoài Nguyên, Từ điển tiếng địa phương N g h ệ - ĩ ĩn h , NXB Văn hóa Thông tin, Hà Nội, 1999, 460tr.
2. Phan Huy Khánh, Thiết kế từ điển phát âm tiếng Việt trong Microsoft Windows, Tạp chí Khoa học Công nghệ. Số 19+20, 1999, tr.21-27.
3. Phan Huy Khánh (chủ trì), Thiết kê hệ thông khai thác cơ sở dữ liệu từ vựng đa ngừ Pháp-Anh-Việt, Đề tài NCKH cấp Bộ, mã sô B2001-15-04, Đà Nang 2001-2002, Lưu Bộ Giáo dục và Đào tạo.
4. Phan Huy Khánh, Võ Trung Hùng. Thiết kế cơ sỏ dữ liệu đa ngữ ngữ pháp tiếng Việt. Tạp chí Khoa học Công nghệ, No 36+37, 2002, tr. 19-24.
5. Phan Huy Khánh, Xây dựng cơ sở dữ liệu từ vựng đa ngữ sử dụng, dạng thức văn bản RTF WinWord, Kỷ yếu Hội thảo Khoa học Quốc gia Lần thứ n h ấ t , ICT.rda’2003
HàNội, 2003, trl03-110.
6. M. Mangeot-Lerebours, Environnements centralises et distribués pour lexicographes et lexico-logues en contexte multilingue, Luận án Tiến sĩy 9/2001, UJF, CH Pháp, ĐHTH Joseph Fourrier
7. Hoàng Phê, Từ điên chính tả , Trung tâm Từ điển học, NXB Đà Nẵng, 1995, 511tr.8. Hoàng Phê, Từ điển tiếng Việt, Trung tâm Từ điển học, NXB Đà Nẳng, 1997, 1130tr.
9. Nguyền Kim Thản, Ngữ pháp tiếng Việt, NXB Giáo dục, 1997, 232 tr.
10. Nguyễn Như Ý, Đại từ điển tiếng Việt, NXB Văn hóa-Thông tin, Hà Nội 1999, 1892 tr.