Loading...
NikolaKalev avatar NikolaKalev 1 Точки

Dimensionality Curse - как да се справим?

- Здравейте, спомням си че Данчо беше предлагал начин за справяне с "curse of dimensionality" т.е. имаме повече колкони от колкото записи в данните. Прегледах видеата от последния ML курс, но не мога да намеря точно тази част. Някой може ли да помогне по темата? 

Благодаря и поздрави!

Тагове:
0
Machine Learning 09/07/2018 14:38:49
dim4o avatar dim4o 288 Точки

Здравей,

Доколкото знам Curse of Dimensionality имаш, когато data от по-ниско измерение е разположена в пространство от по-високо измерение. По този начин search space-а ти се увеличава многократно. Например представи си, че търсиш модел, който да предвижда кой ще победи в някаква игра. Събираш различни параметри - годините опит на играча, процента победи в предните 6 месеца, вида на използваните защити и похвати и т.н. Можеш да имаш 1000 параметъра. Но в релността се оказва, че ако например играта ти е някава логическа и детермистична - винаги този който почва първи да побеждава или да има най-голям шанс за победа. Има примери за такива игри. Така релано имаш само един важен параметър който е разположен в 1000-мерно пространство и търсиш решението като луд.

Не съм напълно съгласен с твърдението, че имаш Curse of Dimensionality обезателно, когато броят на колонките надвишава броят на записите в таблицата, защото интуитивно може да се преположи, че ако увеличим достатъчно броя на записите(съберем повече data) ще се отървем от проклятието. А това не е точно, защото изчисленията ще станат още по-бавни и пак ще имаме да търсим по-прост модел, който е разположен в по-сложен. Ако все броя на записите е под броя на колоните най-вероятно имаш доста по-сериозни проблеми от Curse of Dimensionality.

Естествено решение на проблема е да се направи feature selection и/или да се използват dimensionality reduction техники като PCA. Има една много интересна тема в Quora, в която всички тези неща са обяснени от много различни хора по различни начини: https://www.quora.com/What-is-the-curse-of-dimensionality Обяснението за търсенето на penny например е доста нагледно.

1
Можем ли да използваме бисквитки?
Ние използваме бисквитки и подобни технологии, за да предоставим нашите услуги. Можете да се съгласите с всички или част от тях.
Назад
Функционални
Използваме бисквитки и подобни технологии, за да предоставим нашите услуги. Използваме „сесийни“ бисквитки, за да Ви идентифицираме временно. Те се пазят само по време на активната употреба на услугите ни. След излизане от приложението, затваряне на браузъра или мобилното устройство, данните се трият. Използваме бисквитки, за да предоставим опцията „Запомни Ме“, която Ви позволява да използвате нашите услуги без да предоставяте потребителско име и парола. Допълнително е възможно да използваме бисквитки за да съхраняваме различни малки настройки, като избор на езика, позиции на менюта и персонализирано съдържание. Използваме бисквитки и за измерване на маркетинговите ни усилия.
Рекламни
Използваме бисквитки, за да измерваме маркетинг ефективността ни, броене на посещения, както и за проследяването дали дадено електронно писмо е било отворено.