Статья
Название статьи Применение метода анализа однородности для визуализации и анализа гетерогенных данных
Авторы Гордеев Р.Н.кандидат физико-математических наук, доцент кафедры информационных технологий, roman.gordeev@mail.ru
Библиографическое описание статьи
Рубрика
DOI
УДК 004
Тип статьи
Аннотация Проблемы классификации и ранжирования весьма часто возникают в современном информационном обществе. Будь то потребность ранжировать пользователей информа- ционного ресурса относительно их интересов и предпочтений, анализ потребительских предпочтений посетителей интернет-магазинов, анализ и сопоставление потребительских свойств однотипных товаров и многое другое. Для решения большинства подобных проблем зачастую применяются эмпирические методы, в частности случайный лес, который доказал свою состоятельностьдля состав- ления очень точных прогнозов при решении задач регрессии и классификации. В работе рассматриваются проблемы ранжирования и классификации, а также пред- ложена адаптация метода анализа однородности для эффективной визуализации коми- тетов решающих деревьев, в том числе и для визуализации новых наблюдений, не во- шедших в обучающую выборку.
Ключевые слова классификация, анализ однородности, визуализация графов
Информация о статье
Список литературы 1. Goldberger J. Neighbourhood Components Analysis / Goldberger, J., Roweis, S., Hinton, G. and Salakhutdinov, R. Advances in Neural Information Processing System, 2005. Vol. 17. P. 513520. 2. Sugiyama M. Dimensionality Reduction of Multimodal Labeled Data by Local Fisher Discriminant Analysis // The Journal of Machine Learning Research. 2007. № 8. P. 1061. 3. Breiman L. Random Forests // Machine Learning. 1997. № 45. P. 532. 4. Breiman L. Bagging Predictors // Machine Learning. 1996. № 24. P. 123140. 5. Friedman J. Predictive Learning via Rule Ensembles /J. Friedman and B. Popescu // The Annals of Applied Statistics. 2008. № 2. P. 916954. 6. De Leeuw J. Homogeneity Analysis in R: The Package Homals / De Leeuw J. and Mair P. // Journal of Statistical Software. 2008. № 31. P. 121. 7. Michailidis G. The Gifi System of Descriptive Multivariate Analysis / Michailidis G. and De Leeuw J. // Statistical Science. 1998. Vol. 13. № 4. P. 307336. 8. Breiman L. Classification and Regression Trees / L. Breiman, J. Friedman, R. Olshen and C. Stone 1998. Belmont: Wadsworth 9. Liaw A. Classication and Regression by Random Forest / A. Liaw and M. Wiener // R News. 2002. № 2. P. 1822. 10. Lin Y. Random Forests and Adaptive Nearest Neighbors / Y. Lin and Y. Jeon // Journal of the American Statistical Association. 2006. № 101. P. 578590. 11. Shi T. Unsupervised Learning With Random Forest Predictors / Shi T. and Horvath S. // Journal of Computational and Graphical Statistics. 2006. № 15. P. 118138. 12. Urbanek S. Visualizing Trees and Forests // in Handbook of Data Visualization. 2008. Berlin, Heidelberg: Spinger. P. 243264. 13. Borg I. and Groenen P. Modern Multidimensional Scaling: Theory and Applications 1997. New York. 14. Kruskal J. Nonmetric Multidimensional Scaling: A Numerical Method // Psychometrika. 1964. № 29. P. 115129. 15. Kruskal J., Wish M. Multidimensional Scaling. 1978. Beverly Hills: Sage Publications.
Полный текст статьиПрименение метода анализа однородности для визуализации и анализа гетерогенных данных