Метод главных компонент

Метод главных компонент (англ. Principal component analysis, PCA) - один из основных методов, используемых для уменьшения размерности данных с наименьшей потерей информации. Разработан К. Пирсоном (англ. Karl Pearson) в 1901 г. Применяется в распознавании образов, сжатии данных, компьютерном зрении и т. п. Вычисление главных компонент сводится к расчёту собственных векторов и собственных значений матрицы исходных данных. Также метод главных компонент известен как преобразование Кархунена-Лоэва (англ. Karhunen-Loeve) или преобразование Хотеллинга (англ. Hotelling transform).

Пусть Х(n x m) - матрица наблюдений за переменными x1, x2, …, xm и пусть S - матрица этих переменных. Варианты расчёта матрицы S в зависимости от её типа: