Xử lý ngôn ngữ tự nhiên

Thông tin chung
Mã học phần: 
MAT6087
Chuyên ngành: 
Cơ sở toán học cho tin học
Tóm tắt môn học

Trong thời đại thông tin hiện nay, nhu cầu khai thác ngôn ngữ trong các ứng dụng càng ngày càng lớn: Dịch tự động, kiểm tra/chữa lỗi chính tả, ngữ pháp tự động, tìm kiếm và trích rút thong tin, tóm tắt văn bản, đối thoại người – máy, v.v. Vì vậy, xử lí ngôn ngữ tự nhiên (natural language processing) đã trở thành một trong các lĩnh vực phát triển mũi nhọn. Đây là một lĩnh vực nghiên cứu liên ngành, gắn liền Tin học và Ngôn ngữ học.

Chuyên đề nhằm mục đích cung cấp cho học viên cao học kiến thức tổng quan về lĩnh vực "Xử lí ngôn ngữ tự nhiên" và ứng dụng. Học viên sẽ được giới thiệu các phương pháp chung được sử dụng trong xử lí văn bản ở các mức từ vựng, cú pháp, ngữ nghĩa cũng như xử lí đa ngữ. Đối với mỗi mức xử lí, học viên đều được giới thiệu về các nghiên cứu hiện tại liên quan đến tiếng Việt.

Tài liệu bắt buộc

  • R. Mitkov (2002), The Oxford Handbook of Computational Linguistics, Oxford Univ. Press.
  • Jurafsky D., Martin J.H. (2008), Speech and Language Processing: An introduction to natural language processing, computational linguistics, and speech recognition, second edition, Prentice-Hall.

 Tài liệu tham khảo thêm

  • Manning C.D., Schütze H. (1999), Foundations of Statistical Natural Language Processing, The MIT Press, Cambridge, Massachusetts.
  • Abeille A. (1993), Les nouvelles syntaxes, Armand Colin.
  • Pierrel J.M. (2000), Ingénerie des langues, Hermès, France.