Tối ưu hóa KPCA bằng GA để chọn các thuộc tính đặc trưng nhằm tăng hiệu quả phân lớp của thuật toán Random Forest
Phân tích thành phần chính (PCA) là một phương pháp khá nồi tiếng và hiệu quà trong
quá trình làm giảm số tíiuộc tính cùa tập dữ liệu đầu vào. Hiện nay phưang pháp hàm nhân đã
được dùng để tăng khả năng áp dụng PCA khi giải quyết các bài toán phi tuyến. Phương pháp này
đã được Scholkhof và đồng nghiệp của ông đưa ra với tên gọi là KPCA. Trong bài báo này chúng
tôi sẽ trình bày một cách tiếp cận mới dựa trên hàm nhân để có thể chọn ra những tíiuộc tính tốt
nhất để tăng khà năng phân lớp của thuật toán Random Forest (RF). Chúng tôi đă sử dụng giải
thuật di ừiiyền để tìm ra hàm nhân tối ưu cho việc tìm ra cách chuyển đồi phi tuyến tốt nhất nhằm
!àm tăng khả năng phân lớp của RF. Cách tiếp cận của chúng tôi về cơ bản đã tăng khả nẫng phân
lớp của giải thuật RF. Không chỉ tăng được khả năng phân lớp cho thuật toán RF, phương pháp đề
nghị còn cho thấy khà năng phân lớp tốt hơn một số phương pháp trích chọn đã được công bố