3 основни подхода към машинното обучение
Помниш ли как си се обучавал в училище? Учителите вероятно са ти давали инструкции как се решават задачи, може би сам си търсил нови знания или пък си разчитал на грешките си. Това са и трите основни вида машинно обучение и начини, по които се подхожда към свързаните дейности. В детайли ще ги разгледаш по време на предстоящия курс Machine Learning - септември 2023. По повод предстоящото му издание, в днешната статия ще ти представя по-подробно тези парадигми.
Именно защото ние хората се учим по тези начини, сме създали възможност и машините да се обучават така. Нека видим какво трябва да знаеш за тях и кога са подходящи за приложение!
Източник: Potentia Analytics
1. Контролирано учене
Познато и като надзиравано обучение. Контролираното учене (supervised learning) изисква определена рецепта, инструкции стъпка-по-стъпка, които машината да следва. Представи си как ти си следвал рецепта първия път, когато си сготвил за себе си. Целта ти е да постигнеш резултат като този от рецептата.
Машините получават маркирани входни данни – съставките на рецептата, и примерен краен резултат, като този от рецептата. Водят се по този краен резултат, когато правят изводи на база на нови данни. Емблематичен пример за това са спам филтрите на пощите, които се обучават спрямо примерни спам имейли и така правят извод дали даден бъдещ имейл трябва да попадне в спам папката или не.
Два са подходите при контролирано учене:
- Класификация – при която тестовите данни се категоризират с помощта на алгоритми. Подобен подход се използва за разпознаване на изображения, при примера със спама, в диагностиката и т.н.
- Регресия – регресионният подход служи за разбиране на връзките между зависими и независими променливи, например при изчисляване продължителността на живота, прогнозите за времето, пазарни прогнози и т.н.
2. Неконтролирано учене
Можеш да го срещнеш и като ненадзиравано обучение. Неконтролираното учене (unsupervised learning) премахва рецептата от уравнението. В случая входящите данни не се маркират, а машината и алгоритмите, с които си служи, търси модели на поведение, връзки и шаблони, на база на които прави изводи.
Най-популярният подход при неконтролираното учене е създаването на клъстери. Ето някои примери:
- Потребителска сегментация – необходима на маркетинга и екипите по продажба. Те разполагат с информация за интереси, възраст, пол, локация, потребителско поведение и навици, и т.н. При клъстеризация, алгоритмите могат да създадат т.нар. сегменти на база на идентични признаци.
- Системи за препоръки – мисли си за стрийминг услугите и онлайн магазини като Amazon. Spotify ти пуска музика, която прилича на тази, която си слушал досега. Алгоритми, генериращи препоръки, стоят в сърцето и на Netflix.
- Киберсигурност – машини, които се обучават неконтролирано, могат да се специализират в засичането на необичайни модели на поведение и шаблони на поведението, които се отклоняват от нормата. Това им помага да засичат потенциални рискове и заплахи.
Източник: WordStream
3. Учене с подсилване/с утвърждение
Ученето с утвърждение (reinforcement learning) е вид ненадзиравано обучение. То е непрекъснат процес, вдъхновен от ученето тип проба-грешка – подход, присъщ за хората, когато изпробваме нещо ново или възприемаме експериментален подход.
Както сме се научили да караме колело след редица пъти, в които сме паднали, така и алгоритмите се обучават при взаимодействие със средата, в която работят. При това взаимодействие, машината взима решения, анализира резултата и адаптира последващи решения спрямо него.
По този начин се получават решения в реално време, развиват се умения, а и така работят автономните автомобили. Препоръките на Spotify и Netflix, които разгледахме във връзка с неконтролираното обучение, са вид учене с утвърждение, защото може да дадеш на машината и алгоритмите ѝ сигнал, че това предложение е или не е подходящо. Алгоритмите ще се адаптират според взаимодействието.
Днес алгоритмите за машинно обучение са навсякъде около нас. Взаимодействаме си с тях ежедневно, независимо дали го осъзнаваме или не. В курса ще се запознаеш с най-разпространените алгоритми за ML, с оглед на парадигмата, която трябва да се използва. Ще разбереш кой алгоритъм в кои случаи се използва, как можеш да го обучаваш и как да го тестваш.
Предстоящият курс Machine Learning - септември 2023 може да бъде твоята отправна точка към кариера като Machine Learning инженер, Data Scientist и други. След като придобиеш практически умения и знания по темата, можеш да надградиш с deep learning парадигмата. Това е специфичен вид машинно обучение, който разчита на йерархичния подход. Deep learning и асоциираните невронни мрежи са и обект на последващ курс, който ще ти помогне да направиш следваща крачка към професионалното ти развитие.
А за да вземеш максимума и да стартираш успешно е необходимо да имаш основни познания по програмиране и математика, както и минимални Python познания и умения с езика. Не се колебай и се запиши още днес, очакваме те!