Dummy variables в bank датабазата от лабове Linear and Logistic Regression и Model Training and Improvement
Здравейте, колеги,
Един въпрос относно преобразуването на categorical в dummy variables в първите два лаба. На теория, когато имам Х на брой променливи, които трябва да преобразувам, dummy променливите ми трябва да са Х-1 на брой. Но в лабовете ако махна по една dummy променлива от всяка categorical, матрицата ми става с размер (4521, 42), а според теста трябва да е (4521,51), т.е. оставам със силно корелирани dummy променливи (aka dummy varibale trap). В Linear and Logistic Regression лаба това е оправено накрая с MinMaxScaler(), но в Model Training and Improvement лаба не видях този проблем да е адресиран по някакъв начин. Ще се радвам, ако някой ми обясни къде бъркам, или дали има нещо, което пропускам!
Благодаря!