Klasyfikacja danych, algorytmy redukcji i edycji zbiorów wykorzystujące miarę reprezentatywności

dc.contributor.authorRaniszewski, Marcin
dc.date.accessioned2015-06-03T11:14:51Z
dc.date.available2015-06-03T11:14:51Z
dc.date.issued2010
dc.description.abstractKlasyfikacja danych to podejmowanie decyzji na podstawie informacji, które te dane przenoszą (tzw. cech danych). Prawidłowa i szybka klasyfikacja zależy od prawidłowego przygotowania zbioru danych, jak i doboru odpowiedniego algorytmu klasyfikacji. Jednym z takich algorytmów jest popularny algorytm najbliższego sąsiada (NN). Jego zaletami są prostota, intuicyjność i szerokie spektrum zastosowań. Jego wadą są duże wymagania pamięciowe i spadek szybkości działania dla ogromnych zbiorów danych. Algorytmy redukcji usuwają znaczną część elementów ze zbioru danych, co znacząco przyspiesza działanie algorytmu NN, jednocześnie pozostawiając te, na podstawie których nadal można z zadawalającą jakością klasyfikować dane. Algorytmy edycji oczyszczają zbiór danych z nadmiarowych i błędnych elementów. W artykule zaprezentowane zostaną algorytm redukcji i algorytm edycji zbiorów danych, obydwa wykorzystujące miarę reprezentatywności. Testy przeprowadzono na kilku dobrze znanych w literaturze zbiorach danych różnej wielkości. Otrzymane wyniki są obiecujące. Zestawiono je z wynikami innych popularnych algorytmów redukcji i edycji.pl_PL
dc.description.abstractIn data classification we make decision based on data features. Proper and fast classification depends on a Preparation of a data set and a selection of a suitable classification algorithm. One of these algorithms is popular Nearest Neighbor Rule (NN). Its advantages are simplicity, intuitiveness and wide rangę of applications. Its disadvantages are large memory requirements and decrease in speed for large data sets. Reduction algorithms remove much of data, which significantly speeds up NN. Simultaneously, they leave that data on the basis of which we can still make decisions with an acceptable classification quality. Editing algorithms remove redundant and atypical data from a data set. In this paper new reduction and editing algorithms, both using the representative measure, are presented. Tests were performed on several well-known in the literature data sets of different sizes. The results are promising. They were compared with the results of other popular reduction and editing procedures.en_EN
dc.formatapplication/pdf
dc.identifier.citationZeszyty Naukowe Politechniki Łódzkiej. Elektryka., 2010 z.121 s.463-486 sum.
dc.identifier.issn0374-4817
dc.identifier.other0000027224
dc.identifier.otherW serii gł. nr 1078. Zeszyt jubileuszowy. 15 lat Katedry Informatyki Stosowanej.
dc.identifier.urihttp://hdl.handle.net/11652/407
dc.language.isopl
dc.language.isoen
dc.publisherWydawnictwo Politechniki Łódzkiejpl_PL
dc.publisherLodz University of Technology. Pressen_EN
dc.relation.ispartofseriesZeszyty Naukowe Politechniki Łódzkiejpl_PL
dc.titleKlasyfikacja danych, algorytmy redukcji i edycji zbiorów wykorzystujące miarę reprezentatywności
dc.title.alternativeData classification, data set reduction and editing algorithms using the representative measure
dc.typeArtykuł
dc.typeArticleen_EN

Pliki

Oryginalne pliki

Teraz wyświetlane 1 - 1 z 1
Brak miniatury
Nazwa:
Klasyfikacja_danych,_algorytmy_Raniszewski_2010.pdf
Rozmiar:
314.68 KB
Format:
Adobe Portable Document Format