На какви въпроси може да ни отговори Data Science?
Вероятно сте срещали като понятие Data Science все някъде. Очевидно става въпрос за наука за данните, но не просто малка извадка от тях, а обем, който много трудно бихте си представили. Двигателят зад data science е така нареченото машинно самообучение – способността на много мощни компютри да поемат невъобразимо големи обеми данни, да ги прекарват през алгоритъм и да ни дават резултати.
Но какъв тип резултати бихме искали от тях?
Запознайте се с няколко ясни примера, които ще ви позволят да си представите какво очакваме компютрите да ни кажат:
А или В?
Това е най-простата група, наречена двукласова класификация – има два възможни отговора, които често са „да“ или „не“. Ако трябва по прост начин да представим типовете въпроси, на които отговаря, те биха били нещо от сорта на:
- Може ли продуктът ни да издържи дадено натоварване?
- Този потребител ще продължи ли да използва услугите ни?
A или В… или C? Може би D?
Мултикласовата класификация е друга група от алгоритмични операции, които се използват често от data science. Този тип класификация е разширение на предишния и се занимава с по-сложни въпроси от типа на:
- На каква тема е тази книга?
- На кой модел кола е тази реклама?
Това нормално ли е?
Засичането на аномалии е нещо много полезно в модерното производство, а даже и в системите за отбрана и много други широкоразпространени или нишови приложения. Както можете да познаете, повечето от въпросите, които можем да попитаме алгоритъм за засичане на аномалии се свеждат до:
- Това различно ли е от нормалното поведение?
Колко?
Тази група се нарича „регресия“ и се различава с това, че търси определено количество. Като примерни въпроси можем да дадем:
- Колко коли се очаква да продадем?
- Колко от колите биха се повредили преди даден брой километри?
Какво да правя сега?
Да, може да се стигне до там, че при достатъчно конкретни данни на входа, можем да получим един кратък поглед в бъдещето на изхода. Тази група основава съществуването си не само на достигането до даден тип резултат, но и взимането на решение спрямо него.
Поначало този тип алгоритми са вдъхновени от механизмите за награждаване, които всички животни, включително и ние, споделят. Машините, които ги изпълняват се обучават на базата на обратна връзка относно колко добро решение са взели и главно се използват в различни видове автоматизирани системи.
Въпросите към тях биха представлявали нещо такова:
- По кой маршрут ще стигна най-бързо спрямо пътната обстановка днес?
- Кой от всички възможни отговори би бил най-адекватен на зададения въпрос?
Не е нужен модерен суперкомпютър, за да решите какво вие да направите, обаче! Това е така, защото вече можете да станете част от най-новото ни обучение по Data Science още днес!
Курсът започва на 12-ти декември и ще се провежда всеки понеделник от 18:00! Заявете своето място в него още днес – местата се изчерпват бързо!