Solución Confirmada / error-pipeline-datos-no-numericos-pdwe9

Error de ajuste en el Pipeline debido a datos no numéricos

Scikit-learn Pipelines

Diagnóstico del error

Cuando se construye un Pipeline en Scikit-learn, cada etapa espera que los datos sean del tipo adecuado. Si uno de los transformadores intenta procesar columnas categóricas sin una codificación adecuada, lanzará un error de entrada durante el ajuste.

Fix Sugerido
Asegúrate de usar un `ColumnTransformer` con `OneHotEncoder` o `LabelEncoder` para las características categóricas antes de pasar a las etapas de modelado. Aquí un ejemplo:

```python
from sklearn.compose import ColumnTransformer
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import OneHotEncoder
from sklearn.linear_model import LogisticRegression

categorical_features = ['categoría']
numeric_features = ['edad', 'ingreso']

preprocessor = ColumnTransformer(
    transformers=[
        ('cat', OneHotEncoder(), categorical_features),
        ('num', 'passthrough', numeric_features)
    ])

pipeline = Pipeline(steps=[('preprocessor', preprocessor), ('classifier', LogisticRegression())])
```

Recursos Premium para Scikit-learn Pipelines

Otras consultas relacionadas