KHAI MỎ DỮ
LIỆU VỚI NGÔN NGỮ R
Chương
1:
Giới thiệu về khám phá tri thức và khai mỏ dữ liệu
(slides)
1.1 Khám phá tri thức
và khai mỏ dữ liệu...................................................
2
1.2 Nội dung sách....................................................................................
6
Chương
2:
Giải thuật k láng giềng (slides)
(eval)
2.1 Giải thuật k láng
giềng.........................................................................
7
2.2 Giải thuật k láng
giềng trong R (code)..................................................
9
2.3 Phương pháp đánh
giá hiệu quả phân lớp............................................
12
2.3.1 Nghi thức kiểm
tra.......................................................................
12
2.3.2 Độ đo hiệu quả
của giải thuật.......................................................
12
2.4 Bài tập...............................................................................................
14
Chương
3:
Giải thuật Bayes ngây thơ (slides)
3.1 Phương pháp Bayes
thơ ngây.............................................................
15
3.2 Giải thuật Bayer
ngây thơ trong R (code)............................................
18
3.3 Bài tập...............................................................................................
21
Chương
4:
Máy học cây quyết định (slides)
4.1 Giải thuật học
cây quyết định.............................................................
22
4.2 Cây quyết định
trong R (tree, rpart)...................................................
28
4.3 Bài tập...............................................................................................
31
Chương
5:
Phương pháp tập hợp mô
hình (slides)
5.1 Giải thuật Bagging..............................................................................
32
5.2 Giải thuật Boosting.............................................................................
34
5.3 Rừng ngẫu nhiên................................................................................
35
5.4 Phương pháp tập
hợp mô hình trong R...............................................
37
5.4.1 Bagging (code-update)....................................................................
37
5.4.2 Boosting (code-update)..................................................................
39
5.4.3 Rừng ngẫu nhiên (code)...............................................................
41
5.5 Bài tập...............................................................................................
43
Chương
6:
Máy học véctơ hỗ trợ (slides)
6.1 Giải thuật máy
học SVM...................................................................
45
6.2 Mô tả thư viện
hàm svm trong R (code).............................................
52
6.3 Bài tập..............................................................................................
56
Chương
7:
Giải thuật gom cụm (slides)
7.1 Mô hình gom cụm
phân cấp..............................................................
58
7.2 Giải thuật gom
cụm kMeans..............................................................
59
7.3 Mô tả thư viện
hàm gom cụm dữ liệu trong R....................................
63
7.3.1 Phương pháp gom
cụm phân cấp (agnes, diana)......................... 63
7.3.2 Giải thuật gom
cụm kMeans (code)............................................ 66
7.4 Bài tập.............................................................................................
68
Chương
8:
Giải thuật luật kết hợp (slides)
8.1 Giải thuật luật
kết hợp Apriori...........................................................
71
8.2 Giải thuật
Apriori trong R (code)......................................................
74
8.3 Bài tập.............................................................................................
77
Chương
9:
Hiển thị dữ liệu và phương pháp giảm chiều (slides)
9.1 Phương pháp hiển
thị dữ liệu.............................................................
80
9.1.1 Phương pháp
scatterplot 2 chiều trong R (code)..........................
81
9.1.2 Phương pháp
trục tọa độ song song trong R (code).................... 82
9.1.3 Phương pháp
hiển thị khác trong R (code)................................. 84
9.2 Phương pháp giảm
chiều..................................................................
86
9.2.1 Phương pháp
phân tích thành phần chính (code)........................ 87
9.2.2 Phương pháp
giảm chiều MDS (code)........................................ 89
9.2.3 Mạng nơ-ron SOM (code)......................................................... 92
9.3 Bài tập............................................................................................
94
Chương
10:
Kết luận và hướng phát triển
10.1 Kết luận........................................................................................
95
10.2 Hướng phát triển...........................................................................
98
PHỤ LỤC............................................................................................
101
Chương
11:
Ôn tập xác suất thống kê
11.1 Xác suất......................................................................................
103
11.1.1 Định nghĩa............................................................................
103
11.1.2 Tính chất..............................................................................
103
11.1.3 Công thức xác
suất...............................................................
103
11.2 Thống kê....................................................................................
104
11.2.1 Tổng thể chung
và mẫu (population, sample).........................
104
11.2.2 Thống kê mô tả....................................................................
105
11.2.3 Biến ngẫu
nhiên và phân phối xác suất...................................
106
Chương
12:
Giới thiệu ngôn ngữ R (NNR.pdf)
12.1 R căn bản...................................................................................
107
12.2 Lập trình trong
môi trường R (NBC, RF-Reg).............................. 114
TÀI
LIỆU
THAM KHẢO
-----------------