Solución Confirmada / fuga-datos-pipeline-scikit-learn-pdwe9
Problemas de fuga de datos al encajar el Pipeline
Diagnóstico del error
Si se realiza la normalización del conjunto de prueba junto con el de entrenamiento, se introduce la fuga de datos, lo que lleva a una evaluación engañosa del modelo. Esto ocurre comúnmente con el uso incorrecto de fit_transform en lugar de fit.
Fix Sugerido
Siempre utiliza fit para los datos de entrenamiento y transform para los de prueba. Un ejemplo correcto podría ser:
```python
pipeline.fit(X_train, y_train)
X_test_transformed = pipeline.transform(X_test)
```