Статья |
---|
Название статьи |
Применение метода анализа однородности для визуализации и анализа гетерогенных данных |
Авторы |
Гордеев Р.Н.кандидат физико-математических наук, доцент кафедры информационных технологий, roman.gordeev@mail.ru |
Библиографическое описание статьи |
|
Рубрика |
|
DOI |
|
УДК |
004 |
Тип статьи |
|
Аннотация |
Проблемы классификации и ранжирования весьма часто возникают в современном
информационном обществе. Будь то потребность ранжировать пользователей информа-
ционного ресурса относительно их интересов и предпочтений, анализ потребительских
предпочтений посетителей интернет-магазинов, анализ и сопоставление потребительских
свойств однотипных товаров и многое другое.
Для решения большинства подобных проблем зачастую применяются эмпирические
методы, в частности случайный лес, который доказал свою состоятельностьдля состав-
ления очень точных прогнозов при решении задач регрессии и классификации.
В работе рассматриваются проблемы ранжирования и классификации, а также пред-
ложена адаптация метода анализа однородности для эффективной визуализации коми-
тетов решающих деревьев, в том числе и для визуализации новых наблюдений, не во-
шедших в обучающую выборку.
|
Ключевые слова |
классификация, анализ однородности, визуализация графов |
Информация о статье |
|
Список литературы |
1. Goldberger J. Neighbourhood Components Analysis / Goldberger, J., Roweis, S.,
Hinton, G. and Salakhutdinov, R. Advances in Neural Information Processing System, 2005.
Vol. 17. P. 513520.
2. Sugiyama M. Dimensionality Reduction of Multimodal Labeled Data by Local Fisher
Discriminant Analysis // The Journal of Machine Learning Research. 2007. № 8. P. 1061.
3. Breiman L. Random Forests // Machine Learning. 1997. № 45. P. 532.
4. Breiman L. Bagging Predictors // Machine Learning. 1996. № 24. P. 123140.
5. Friedman J. Predictive Learning via Rule Ensembles /J. Friedman and B. Popescu //
The Annals of Applied Statistics. 2008. № 2. P. 916954.
6. De Leeuw J. Homogeneity Analysis in R: The Package Homals / De Leeuw J. and
Mair P. // Journal of Statistical Software. 2008. № 31. P. 121.
7. Michailidis G. The Gifi System of Descriptive Multivariate Analysis / Michailidis G.
and De Leeuw J. // Statistical Science. 1998. Vol. 13. № 4. P. 307336.
8. Breiman L. Classification and Regression Trees / L. Breiman, J. Friedman, R. Olshen
and C. Stone 1998. Belmont: Wadsworth
9. Liaw A. Classication and Regression by Random Forest / A. Liaw and M. Wiener //
R News. 2002. № 2. P. 1822.
10. Lin Y. Random Forests and Adaptive Nearest Neighbors / Y. Lin and Y. Jeon //
Journal of the American Statistical Association. 2006. № 101. P. 578590.
11. Shi T. Unsupervised Learning With Random Forest Predictors / Shi T. and
Horvath S. // Journal of Computational and Graphical Statistics. 2006. № 15. P. 118138.
12. Urbanek S. Visualizing Trees and Forests // in Handbook of Data Visualization. 2008.
Berlin, Heidelberg: Spinger. P. 243264.
13. Borg I. and Groenen P. Modern Multidimensional Scaling: Theory and Applications
1997. New York.
14. Kruskal J. Nonmetric Multidimensional Scaling: A Numerical Method //
Psychometrika. 1964. № 29. P. 115129.
15. Kruskal J., Wish M. Multidimensional Scaling. 1978. Beverly Hills: Sage Publications. |
Полный текст статьи | Применение метода анализа однородности для визуализации и анализа гетерогенных данных |