Seminarium ZMK

Metody kondensacji zbioru odniesienia dla reguł decyzyjnych opartych na funkcjach odległości

Artur Sierszeń

czwartek, 19 lutego 2009, godz. 12:15, sala S-4

Zostaną przedstawione algorytmy kondensacji zbioru odniesienia dla reguły najbliższego sąsiada (1-NN). Regułą 1-NN można aproksymować regułę k najbliższych sąsiadów (k-NN), która należy do najbardziej efektywnych metod klasyfikacji, w sensie najmniejszego prawdopodobieństwa klasyfikacji mylnej. Zastąpienie reguły k-NN regułą 1-NN znacznie upraszcza i przyspiesza klasyfikację. Dalsze przyspieszenie można uzyskać poprzez redukcję zbioru odniesienia, którym początkowo jest cały zbiór uczący. Opracowano już szereg algorytmów redukcji zbioru odniesienia. Wielkości wynikowych zbiorów odniesienia są wyznaczane przez te algorytmy i są one tym większe, im większe są zbiory oryginalne. Nie ma możliwości uzyskiwania zbiorów odniesienia o zadanej wielkości. Tym bardziej, znane metody nie dają możliwości sterowania kompromisem pomiędzy szybkością klasyfikacji a jej jakością, w sensie prawdopodobieństwa poprawnych decyzji. Autor zaproponował cztery algorytmy, które wypełniają w pewnym stopniu tę lukę: algorytm hiperpłaszczyzn tnących, modyfikacja algorytmu Changa, kaskadowy algorytm stanowiący kombinację dwóch poprzednich, oraz algorytm nazwany przez autora bąbelkowym. Zostaną one przedstawione i omówione. Prezentowana praca stanowi rozprawę doktorską prelegenta.