Thuật toán khai thác dữ liệu • Thuật toán ID3 • Thuật toán ILA
Bảng dữ liệu (ví dụ : ID3) STT Kích thướ c Màu
Dạng
Quyết định
1
Vừa
Xanh dươ ng ng
Hộ p
Có
2
Nhỏ
Đỏ
Nón
Không
3
Nhỏ
Đỏ
Cầu
Có
4
Lớ n
Đỏ
Nón
Không
5
Lớ n
Xanh lá cây
Tr ụ
Có
6
Lớ n
Đỏ
Tr ụ
Không
7
Lớ n
Xanh lá cây
Cầu
Có
Bảng phân mảnh Theo thuật Toán ID3 STT Kích thướ c Màu
Dạng
Quyết định
Xanh dươ ng ng
Hộp
Có
2 Nhỏ 4 Lớ n
Đỏ Đỏ
Nón
Không Không
3 Nhỏ 7 Lớ n
Đỏ Xanh lá cây
Cầu
Lớ n Lớ n
Xanh lá cây Đỏ
Trụ
1
5 6
Vừa
Nón
Cầu
Trụ
Có Có Có Không
Bảng phân mảnh Theo thuật Toán ID3 STT Kích thướ c Màu 5 Lớ n Xanh lá cây 6 Lớ n Đỏ
Dạng Trụ Trụ
Quyết định Có Không
STT Kích thướ c Màu
Dạng
Quyết định
5
Lớ n
Xanh lá cây
Trụ
Có
6
Lớ n
Đỏ
Trụ
Không
ID3 sinh ra Cây Quyết Định Dạng Hộp
có
không
Nón
Cầu
Trụ
Màu
có
Xanh lá cây
có
Đỏ
không
Luật rút ra từ cây quyết định • Luật 1: Nếu (Dạng = Hộ p p)) thì Quyết định = Có • Luật 2: Nếu (Dạng = Nón = Nón)) thì Quyết định = Không • Luật 3: Nếu (Dạng = Cầu) thì Quyết định = Có • Luật 4: Nếu (Dạng = Tr ụ) VÀ (Màu = Xanh lá cây) thì Quyết định = Có • Luật 5: Nếu (Dạng = Tr ụ) VÀ (Màu = Đỏ) thì Quyết định = Không
Bảng dữ liệu (ví dụ : ILA) STT Kích thướ c Màu
Dạng
Quyết định
Xanh Dươ ng ng
Hộ p
Có
2 Nhỏ
Đỏ
Nón
Không
3 Nhỏ
Đỏ
Cầu
Có
4
Lớ n
Đỏ
Nón
Không
5
Lớ n
Xanh lá cây
Tr ụ
Có
6
Lớ n
Đỏ
Tr ụ
Không
7
Lớ n
Xanh lá cây
Cầu
Có
1
Vừa
Chia bảng theo lớ p quyết định STT mớ i Kích thướ c Màu Dạng Bảng con 1 1 (1) Vừa Xanh dươ ng ng Hộ p 2 (3) Nhỏ Cầu Đỏ
Quyết định
3 (5) Lớ n 4 (7) Lớ n Bảng con 2 1 (2) Nhỏ 2 (4) Lớ n 3 (6) Lớ n
Xanh lá cây Tr ụ Xanh lá cây Cầu
Có Có
Đỏ Đỏ Đỏ
Không Không Không
Nón Nón Tr ụ
Có Có
Quáá trì Qu trình sin sinhh ra ra lu luật 1 STT mớ i Kích thướ c Màu Dạng Quyết định Bảng con 1 1 Vừa Xanh dươ ng ng Hộ p Có 2 Nhỏ Cầu Có Đỏ 3 Lớ n 4 Lớ n Bảng con 2 1 Nhỏ 2 Lớ n 3 Lớ n
ế
Tr ụ Xanh lá cây Cầu
Có Có
Đỏ Đỏ Đỏ
Không Không Không
Xanh lá cây
Nón Nón Tr ụ
ế
* *
Quáá trì Qu trình sin sinhh ra ra lu luật 2 STT mớ i Kích thướ c Màu Dạng Quyết định Bảng con 1 1 Xanh dươ ng ng Hộ p Có * Vừ a 2 Nhỏ Cầu Có Đỏ 3 Lớ n 4 Lớ n Bảng con 2 1 Nhỏ 2 Lớ n 3 Lớ n
ế
Xanh lá cây Tr ụ Xanh lá cây Cầu
Có Có
Đỏ Đỏ Đỏ
Không Không Không
Nón Nón Tr ụ ế
* *
Quáá trì Qu trình sin sinhh ra ra lu luật 3 STT mớ i Kích thướ c Màu Dạng Quyết định Bảng con 1 1 Vừa Xanh dươ ng ng Hộ p Có * 2 Nhỏ * Cầu Có Đỏ 3 Lớ n 4 Lớ n Bảng con 2 1 Nhỏ 2 Lớ n 3 Lớ n
ế
Xanh lá cây Tr ụ Xanh lá cây Cầu
Có Có
Đỏ Đỏ Đỏ
Không Không Không
Nón Nón Tr ụ
ầ
ế
* *
Quáá trì Qu trình sin sinhh ra ra lu luật 4 STT mớ i Kích thướ c Màu Dạng Quyết định Bảng con 1 1 Vừa Xanh dươ ng ng Hộ p Có 2 Nhỏ Cầu Có Đỏ 3 Lớ n 4 Lớ n Bảng con 2 1 Nhỏ 2 Lớ n 3 Lớ n
ế
Xanh lá cây Tr ụ Xanh lá cây Cầu
Có Có
Đỏ Đỏ Đỏ
Không Không Không
Nón Nón
Tr ụ ế
* *
Quáá trì Qu trình sin sinhh ra ra lu luật 5 STT mớ i Kích thướ c Màu Dạng Quyết định Bảng con 1 1 Vừa Xanh dươ ng ng Hộ p Có 2 Nhỏ Cầu Có Đỏ 3 Lớ n Xanh lá cây Tr ụ Có 4 Lớ n Xanh lá cây Cầu Có Bảng con 2 1 Nhỏ Nón Không * Đỏ 2 Lớ n Nón Không * Đỏ 3 Tr ụ Không * Đỏ Lớ n Luật 5: Nếu Kích thướ c = Lớ n VÀ Màu = Đỏ thì
Luật rút ra từ thuật toán ILA • Luật 1: Nếu Màu = Xanh Lá Cây thì Quyết định = Có • Luật 2: Nếu Kích thướ c = Vừ a thì Quyết định = Có • Luật 3: Nếu Dạng = Cầu thì Quyết định = Có • Luật 4: Nếu Dạng = Nón thì Quyết định = Không • Luật 5: Nếu Kích thướ c = Lớ n VÀ Màu = Đỏ thì Quyết định = Không
So sánh hai thuật toán ID3 và và ILA Thuật Toán ID3 ILA ID3 ILA ID3 ILA ID3 ILA ID3 ILA
Luật (Nếu X thì Quyết định = Y) X: Màu = Xanh lá cây VÀ Dạng = Tr ụ ; Y: Có X: Màu = Xanh lá cây ; Y: Có X: Dạng = Hộ p ; Y: Có X: Kích thướ c = Vừa ; Y: Có X: Màu = Đỏ VÀ Dạng = Tr ụ ; Y: Không X: Kích thướ c = Lớ n VÀ màu = Đỏ ; Y: Không X: Dạng = Cầu ; Y: Có X: Dạng = Cầu ; Y: Có X: Dạng = Nón = Nón ; Y: Không X: Dạng = Nón = Nón ; Y: Không