Entradas

Mostrando las entradas etiquetadas como Aprendizaje automático

Target Encoding en Power BI: La Guía Definitiva Sin Data Leakage

Imagen
Target Encoding en Power BI: La Guía Definitiva Sin Data Leakage Domina esta técnica esencial para modelos predictivos con validación cruzada, smoothing y prevención de overfitting. Código M paso a paso + mejores prácticas. Tabla de Contenidos 1. ¿Qué es Target Encoding? 2. ¿Cuándo usarlo? 3. Riesgos y Prevención 4. Implementación Paso a Paso 5. Código M Completo 6. Validación Cruzada 7. Smoothing Avanzado 8. Uso en DAX 9. Conclusión ¿Qué es Target Encoding (Mean Encoding)? Target Encoding ...

Cómo Realizar One-Hot Encoding en Power BI: Guía Paso a Paso para Principiantes y Expertos

Imagen
Cómo Realizar One-Hot Encoding en Power BI: Guía Paso a Paso Fuente: aiplusinfo.com ¡Hola, comunidad de análisis de datos en Power BI ! Hoy te traigo un tutorial completo para implementar One-Hot Encoding directamente en Power Query . Si estás preparando datos para modelos de machine learning , regresiones lineales o simplemente quieres variables dummy para análisis avanzados, este método es rápido, nativo y escalable . ¡No necesitas R, Python ni extensiones! ¿Qué es el One-Hot Encoding? El One-Hot Encoding convierte variables categóricas (como "Rojo", "Azul", "Verde") en columnas binarias (0 o 1). Categoría Rojo Azul Verde Rojo 1 0 0 Azul 0 1 0 Verde 0 0 1 Ventajas en Power BI : Compatible con DAX y vis...

Descubriendo el Poder de los Modelos de Clasificación en Machine Learning: Predicciones Precisas y Clasificaciones Sorprendentes

Imagen
Clasificación de Materias Primas con Machine Learning en Python El problema de clasificación en Machine Learning permite predecir categorías a partir de datos, como identificar el tipo de materia prima (CD, DB, SBT, R) según características como porcentajes de Grado A, B, C y el peso total del lote. En este artículo, exploramos algoritmos clave como Regresión Logística , Máquina de soporte vectorial (SVM) , Árboles de Decisión , Random Forest , Extreme gradient descent (XGBoost) y K-nearest neighborhood (KNN) , con implementaciones en Python, manejo de datos desbalanceados y evaluación de métricas. ¡Acompáñanos en este viaje técnico! 🚀 Ilustración de clasificación de datos con Machine Learning, representando la asignación de categorías (Fuente: Propia). El Problema de Clasificación de Materias Primas El objetivo es clasificar lotes de materias primas en categorías (CD, DB, SBT, R) según...