MỤC LỤC

KHAI MỎ DỮ LIỆU VỚI NGÔN NGỮ R

Chương 1: Giới thiệu về khám phá tri thức và khai mỏ dữ liệu (slides)

1.1  Khám phá tri thức và khai mỏ dữ liệu................................................... 2

1.2  Nội dung sách.................................................................................... 6

Chương 2: Giải thuật k láng giềng  (slides) (eval)

2.1  Giải thuật k láng giềng......................................................................... 7

2.2  Giải thuật k láng giềng trong R (code).................................................. 9

2.3  Phương pháp đánh giá hiệu quả phân lớp............................................ 12

2.3.1  Nghi thức kiểm tra....................................................................... 12

2.3.2  Độ đo hiệu quả của giải thuật....................................................... 12

2.4  Bài tập............................................................................................... 14

Chương 3: Giải thuật Bayes ngây thơ (slides)

3.1  Phương pháp Bayes thơ ngây............................................................. 15

3.2  Giải thuật Bayer ngây thơ trong R (code)............................................ 18

3.3  Bài tập............................................................................................... 21

Chương 4: Máy học cây quyết định (slides)

4.1  Giải thuật học cây quyết định............................................................. 22

4.2  Cây quyết định trong R (tree, rpart)................................................... 28

4.3  Bài tập............................................................................................... 31

Chương 5: Phương pháp tập hợp  mô hình (slides)

5.1  Giải thuật Bagging.............................................................................. 32

5.2  Giải thuật Boosting............................................................................. 34

5.3  Rừng ngẫu nhiên................................................................................ 35

5.4  Phương pháp tập hợp mô hình trong R............................................... 37

5.4.1  Bagging (code-update).................................................................... 37

5.4.2  Boosting (code-update).................................................................. 39

5.4.3  Rừng ngẫu nhiên (code)............................................................... 41

5.5  Bài tập............................................................................................... 43

Chương 6: Máy học véctơ hỗ trợ (slides)

6.1  Giải thuật máy học SVM................................................................... 45

6.2  Mô tả thư viện hàm svm trong R (code)............................................. 52

6.3  Bài tập.............................................................................................. 56

Chương 7: Giải thuật gom cụm (slides)

7.1  Mô hình gom cụm phân cấp.............................................................. 58

7.2  Giải thuật gom cụm kMeans.............................................................. 59

7.3  Mô tả thư viện hàm gom cụm dữ liệu trong R.................................... 63

7.3.1  Phương pháp gom cụm phân cấp (agnes, diana)......................... 63

7.3.2  Giải thuật gom cụm kMeans (code)............................................ 66

7.4  Bài tập............................................................................................. 68

Chương 8: Giải thuật luật kết hợp (slides)

8.1  Giải thuật luật kết hợp Apriori........................................................... 71

8.2  Giải thuật Apriori trong R (code)...................................................... 74

8.3  Bài tập............................................................................................. 77

Chương 9: Hiển thị dữ liệu và phương pháp giảm chiều (slides)

9.1  Phương pháp hiển thị dữ liệu............................................................. 80

9.1.1  Phương pháp scatterplot 2 chiều trong R (code).......................... 81

9.1.2  Phương pháp trục tọa độ song song trong R (code).................... 82

9.1.3  Phương pháp hiển thị khác trong R  (code)................................. 84

9.2  Phương pháp giảm chiều.................................................................. 86

9.2.1  Phương pháp phân tích thành phần chính (code)........................ 87

9.2.2  Phương pháp giảm chiều MDS (code)........................................ 89

9.2.3  Mạng nơ-ron SOM (code)......................................................... 92

9.3  Bài tập............................................................................................ 94

Chương 10: Kết luận và hướng phát triển

10.1  Kết luận........................................................................................ 95

10.2  Hướng phát triển........................................................................... 98

PHỤ LỤC............................................................................................ 101

Chương 11: Ôn tập xác suất thống kê

11.1  Xác suất...................................................................................... 103

11.1.1  Định nghĩa............................................................................ 103

11.1.2  Tính chất.............................................................................. 103

11.1.3  Công thức xác suất............................................................... 103

11.2  Thống kê.................................................................................... 104

11.2.1  Tổng thể chung và mẫu (population, sample)......................... 104

11.2.2  Thống kê mô tả.................................................................... 105

11.2.3  Biến ngẫu nhiên và phân phối xác suất................................... 106

Chương 12: Giới thiệu ngôn ngữ R (NNR.pdf)

12.1  R căn bản................................................................................... 107

12.2  Lập trình trong môi trường R (NBC, RF-Reg).............................. 114

TÀI LIỆU THAM KHẢO

-----------------