Thông tin chung Mã học phần: MAT6218Học phần tiên quyết: Học máy và Khai phá dữ liệu hoặc Nhập môn suy diễn thống kê Chuyên ngành: Khoa học dữ liệu Tóm tắt môn học Học phần có mục tiêu trang bị cho học viên kiến thức để vận dụng các phương pháp thống kê khi làm việc với các dữ liệu trong lĩnh vực khoa học tự nhiên và khoa học sự sống. Nội dung chính của học phần bao gồm: dữ liệu nhiều chiều và mô tả; phân tích khai phá; mô hình hoá; khảo sát mô hình. Ngoài ra, học viên sẽ được tham gia thực hiện một bài tiểu luận nghiên cứu với chủ đề mở trong lĩnh vực. Các chủ đề ứng dụng sẽ tương ứng với việc làm sạch dữ liệu, các mô tả ban đầu, các bước mô hình hoá dữ liệu, và đánh giá chất lượng mô hình. Sau khi học xong học phần, học viên nắm được cách sử dụng các mô hình thống kê trên một số phần mềm thống kê thông dụng như Excel, Stata, R để phân tích các vấn đề thường gặp trong công việc. Tài liệu tham khảo: Tài liệu bắt buộc Bài giảng của giảng viên Wehrens R. (2011), Chemometrics with R: Multivariate Data Analysis in the Natural Sciences and Life Sciences, Springer. Tài liệu tham khảo thêm Nolan D., Speed T. (2001), Stat Labs: Mathematical Statistics Through Applications, Springer. Peng R. D., Dominici (2008), Statistical Methods for Environmental Epidemiology with R: A Case Study in Air Polution and Health, Springer. Quirk T. J., Quirk M., Horton H. (2013), Exel 2007 for Biological and Life Sciences Statistics, Springer.