Phân tích dữ liệu khoa học chuyên ngành

Thông tin chung
Mã học phần: 
MAT6218
Chuyên ngành: 
Khoa học dữ liệu
Tóm tắt môn học

Học phần có mục tiêu trang bị cho học viên kiến thức để vận dụng các phương pháp thống kê khi làm việc với các dữ liệu trong lĩnh vực khoa học tự nhiên và khoa học sự sống. Nội dung chính của học phần bao gồm: dữ liệu nhiều chiều và mô tả; phân tích khai phá; mô hình hoá; khảo sát mô hình. Ngoài ra, học viên sẽ được tham gia thực hiện một bài tiểu luận nghiên cứu với chủ đề mở trong lĩnh vực. Các chủ đề ứng dụng sẽ tương ứng với việc làm sạch dữ liệu, các mô tả ban đầu, các bước mô hình hoá dữ liệu, và đánh giá chất lượng mô hình. Sau khi học xong học phần, học viên nắm được cách sử dụng các mô hình thống kê trên một số phần mềm thống kê thông dụng như Excel, Stata, R để phân tích các vấn đề thường gặp trong công việc.

Tài liệu tham khảo:

  • Tài liệu bắt buộc
    • Bài giảng của giảng viên
    • Wehrens R. (2011), Chemometrics with R: Multivariate Data Analysis in the Natural Sciences and Life Sciences, Springer.
  • Tài liệu tham khảo thêm
    • Nolan D., Speed T. (2001), Stat Labs: Mathematical Statistics Through Applications, Springer.
    • Peng R. D., Dominici (2008), Statistical Methods for Environmental Epidemiology with R: A Case Study in Air Polution and Health, Springer.
    • Quirk T. J., Quirk M., Horton H. (2013), Exel 2007 for Biological and Life Sciences Statistics, Springer.