Variables ficticias
Mapeando variables categoricas

Cuando tenemos variables categóricas, estas nos agregan un valor determinante para nuestro analisis de datos, pero las mismas deben ser preprocesadas para que puedan ser analizadas por los algoritmos de machine learning o en cualquier analisis estadistico orentado a realizar predicciones. 

Si tenemos un data set siguiente: 

price size year view
0 234314.144 643.09 2015 No sea view
1 228581.528 656.22 2009 No sea view
2 281626.336 487.29 2018 Sea view
3 401255.608 1504.75 2015 No sea view
4 458674.256 1275.46 2009 Sea view

Necesitamos modificar los valores de la columa 'view' por valores numericos que sea válidos para ser procesados posteriormente. 

Para ello utilizaremos el método map de la siguiente forma:

data['view'] = data['view'].map({'Sea view': 1, 'No sea view': 0})

De esta forma podremos limpiar preprocesando todas nuestras variables categoricas fácilmente.

price size year view
0 234314.144 643.09 2015 0
1 228581.528 656.22 2009 0
2 281626.336 487.29 2018 1
3 401255.608 1504.75 2015 0
4 458674.256 1275.46 2009 1


Compartir
Identificarse dejar un comentario
Dtale
Una libreria python para EDA que deberias tener
/*
*/