Phân loại dữ liệu có liên kết sử dụng phương pháp đồng huấn luyện
Trong một số ứng dụng phân loại tự động, bên cạnh các dữ liệu dạng vector còn có dữ
liệu liên kết thể hiện quan hệ giữa các đối tượng như: trang web được nối bởi các siêu liên kết, bài
báo khoa học được liên kết bởi các tài liệu tham khảo, các nút mạng được kết nối vật lý .v.v. Yêu
cầu đặt ra với thuật toán phân loại là tận dụng và kết hợp dữ liệu liên kết với các thông tin khác để
cho kết quả dự đoán chính xác hơn. Nhiều nghiên cứu trước đây đã giải quyết vấn đề này bằng
cách sử dụng các thuật toán dựa trên đồ thị mà tiêu biểu là bộ phân lớp Gaussian-field, các mạng
Hopfield và bộ phân lớp quan hệ láng giềng.v.v. Trong bài báo này, chúng tôi đề xuất giải quyết
vấn đề kết hợp thông tin liên kết với các dữ liệu khác bằng cách sử dụng kỹ thuật đồng huấn luyện,
trong đó các liên kết được coi là một góc nhìn (view) khác của dữ liệu. Phương pháp được thử
nghiệm trên bộ dữ liệu WebKB. Kết quả thử nghiệm và so sánh cho thấy phương pháp đề xuất cho
kết quả phân loại chính xác hơn phương pháp kết hợp dữ liệu liên kết dựa trên đồ thị.