• polski
    • English
Lodz University of Technology Repository
TUL Repository
  • English 
    • polski
    • English
  • Login
View Item 
  •   Home
  • Wydział Elektrotechniki, Elektroniki, Informatyki i Automatyki / Faculty of Electrical, Electronic, Computer and Control Engineering / W2
  • Artykuły (WEEiA)
  • View Item
  •   Home
  • Wydział Elektrotechniki, Elektroniki, Informatyki i Automatyki / Faculty of Electrical, Electronic, Computer and Control Engineering / W2
  • Artykuły (WEEiA)
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Klasyfikacja danych, algorytmy redukcji i edycji zbiorów wykorzystujące miarę reprezentatywności

Thumbnail
View/Open
Klasyfikacja_danych,_algorytmy_Raniszewski_2010.pdf (314.6Kb)
Date
2010
Author
Raniszewski, Marcin
Metadata
Show full item record
Abstract
Klasyfikacja danych to podejmowanie decyzji na podstawie informacji, które te dane przenoszą (tzw. cech danych). Prawidłowa i szybka klasyfikacja zależy od prawidłowego przygotowania zbioru danych, jak i doboru odpowiedniego algorytmu klasyfikacji. Jednym z takich algorytmów jest popularny algorytm najbliższego sąsiada (NN). Jego zaletami są prostota, intuicyjność i szerokie spektrum zastosowań. Jego wadą są duże wymagania pamięciowe i spadek szybkości działania dla ogromnych zbiorów danych. Algorytmy redukcji usuwają znaczną część elementów ze zbioru danych, co znacząco przyspiesza działanie algorytmu NN, jednocześnie pozostawiając te, na podstawie których nadal można z zadawalającą jakością klasyfikować dane. Algorytmy edycji oczyszczają zbiór danych z nadmiarowych i błędnych elementów. W artykule zaprezentowane zostaną algorytm redukcji i algorytm edycji zbiorów danych, obydwa wykorzystujące miarę reprezentatywności. Testy przeprowadzono na kilku dobrze znanych w literaturze zbiorach danych różnej wielkości. Otrzymane wyniki są obiecujące. Zestawiono je z wynikami innych popularnych algorytmów redukcji i edycji.
 
In data classification we make decision based on data features. Proper and fast classification depends on a Preparation of a data set and a selection of a suitable classification algorithm. One of these algorithms is popular Nearest Neighbor Rule (NN). Its advantages are simplicity, intuitiveness and wide rangę of applications. Its disadvantages are large memory requirements and decrease in speed for large data sets. Reduction algorithms remove much of data, which significantly speeds up NN. Simultaneously, they leave that data on the basis of which we can still make decisions with an acceptable classification quality. Editing algorithms remove redundant and atypical data from a data set. In this paper new reduction and editing algorithms, both using the representative measure, are presented. Tests were performed on several well-known in the literature data sets of different sizes. The results are promising. They were compared with the results of other popular reduction and editing procedures.
 
URI
http://hdl.handle.net/11652/407
Collections
  • Artykuły (WEEiA) [134]

DSpace software copyright © 2002-2016  DuraSpace
Contact Us | Send Feedback
Theme by 
Atmire NV
 

 

Browse

All of DSpaceCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

My Account

Login

DSpace software copyright © 2002-2016  DuraSpace
Contact Us | Send Feedback
Theme by 
Atmire NV