Home » Работа с анализом главных компонентов в больших размерностях, часть 5 (машинное обучение + линейная алгебра) | от Монодип Мукерджи | март 2023 г.

Работа с анализом главных компонентов в больших размерностях, часть 5 (машинное обучение + линейная алгебра) | от Монодип Мукерджи | март 2023 г.

  1. Анализ основных компонентов в пространственных формах (arXiv)

Автор: Пуоя Табаги, Майкл Ханзаде, Юсу Ван, Сиваш Мирараб

Аннотация: Анализ главных компонентов (PCA) — это рабочая лошадка современной науки о данных. Практики обычно выполняют PCA, предполагая, что данные соответствуют евклидовой геометрии. Однако для определенных типов данных, таких как иерархические данные, могут быть более подходящими другие геометрические пространства. Мы изучаем PCA в космических формах; то есть с постоянной положительной (сферической) и отрицательной (гиперболической) кривизной, в дополнение к пространствам нулевой кривизны (евклидовы). В любой точке риманова многообразия можно определить риманово аффинное подпространство на основе набора касательных векторов и использовать обратимые карты для проецирования касательных векторов на многообразие и наоборот. Нахождение низкоразмерного риманова аффинного подпространства для набора точек в пространственной форме сводится к уменьшению размерности, поскольку, как мы показываем, любое такое аффинное подпространство изометрично пространственной форме той же размерности и кривизны. Чтобы найти главные компоненты, мы ищем (риманово) аффинное подпространство, которое лучше всего представляет набор многозначных точек данных с минимальной средней стоимостью проецирования точек данных на аффинное подпространство. Мы предлагаем конкретные функции стоимости, которые дают два основных преимущества: (1) аффинное подпространство может быть оценено путем решения собственного уравнения, аналогичного евклидову PCA, и (2) оптимальные аффинные подпространства разных размеров образуют вложенное множество. Эти свойства обеспечивают преимущества по сравнению с существующими методами, которые в основном представляют собой итерационные алгоритмы с медленной сходимостью и более слабыми теоретическими гарантиями. В частности, для гиперболического PCA соответствующее собственное уравнение работает в лоренцевом пространстве с неопределенным скалярным произведением; тем самым мы устанавливаем связь между лоренцевыми и евклидовыми собственными уравнениями. Мы оцениваем предложенную пространственную форму PCA на наборах данных, смоделированных в сферическом и гиперболическом пространствах, и показываем, что она превосходит альтернативные методы по скорости или точности сходимости, часто по обоим.

Read more:  от Джидды до Акабы вновь открываются «его» места

2. Обнаружение неконтролируемой неисправности с высоким импедансом с использованием автоэнкодера и анализа основных компонентов (arXiv)

Автор: Инсян Лю, Мохаммад Разеги-Джахроми, Джеймс Ступис

Аннотация: Обнаружение повреждений с высоким импедансом (HIF) было одной из самых больших проблем в сети распределения электроэнергии. Низкая величина тока и разнообразные характеристики HIF затрудняют их обнаружение реле максимального тока. В последнее время методы, основанные на данных, основанные на моделях машинного обучения, набирают популярность в обнаружении HIF из-за их способности изучать сложные закономерности на основе данных. В большинстве методов обнаружения, основанных на машинном обучении, используются методы обучения с учителем, чтобы отличить HIF от условий нормальной нагрузки, выполняя классификации, которые основаны на большом объеме данных, собранных во время HIF. Однако измерения HIF трудно получить в реальном мире. В результате надежность и обобщение методов классификации ограничены, когда в обучающих данных отсутствуют профили нагрузки и неисправности. Следовательно, в этой статье предлагается неконтролируемая структура обнаружения HIF с использованием автокодировщика и методов мониторинга на основе анализа основных компонентов. Предлагаемый метод обнаружения неисправностей обнаруживает HIF, отслеживая изменения корреляционной структуры в формах тока, которые отличаются от нормальных нагрузок. Производительность предлагаемого метода обнаружения HIF проверяется с использованием реальных данных, собранных из распределительной системы 4,16 кВ, и сравнивается с результатами коммерчески доступного решения для обнаружения HIF. Численные результаты показывают, что предлагаемый метод превосходит коммерчески доступный метод обнаружения HIF, сохраняя при этом высокий уровень безопасности, не допуская ложного обнаружения в условиях нагрузки.

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.