Análisis de Canasta de Mercado
Análisis de 4.9 millones de transacciones para descubrir patrones de compra y reglas de asociación que optimicen estrategias de cross-selling.
📋 Descripción del Proyecto
Market Basket Analysis es una técnica de minería de datos para descubrir relaciones entre productos. Este proyecto analiza 4,975,718 transacciones del supermercado "SanoYFresco" para identificar qué productos se compran frecuentemente juntos.
✨ Características Destacadas
- Descompresión Automática: El notebook detecta y descomprime automáticamente la base de datos (85MB → 406MB)
- Git LFS: Manejo profesional de archivos grandes mediante Git Large File Storage
- 100% Funcional: Sin configuración manual, clonar y ejecutar directamente
- Repositorio Separado: Proyecto independiente con documentación completa
- Probado y Verificado: Todas las funciones testeadas y funcionando correctamente
📊 Dataset
- Total de transacciones: 4,975,718 registros
- Pedidos únicos: 2,060,188 pedidos
- Productos únicos: 40 productos orgánicos
- Período: Año 2023 completo
📈 Resultados Principales
Top 5 Reglas de Asociación
| Si compra... | También compra... | Lift |
|---|---|---|
| Cilantro Orgánico | Limones | 3.6x |
| Cebolla Roja | Cilantro | 3.6x |
| Ajo | Cebolla Amarilla | 3.5x |
| Apio | Zanahorias | 3.3x |
| Apio | Pepino | 3.1x |
💼 Insights Accionables
- Layout: Colocar cilantro cerca de limones
- Promociones: "Pack Guacamole" (Aguacate + Cilantro + Limón)
- Recomendaciones: Al agregar cilantro → Sugerir limones
- Inventario: Mantener stock correlacionado
🛠️ Tecnologías
- Python: Pandas, SQLite, Itertools, Zipfile
- Jupyter Notebook: Entorno interactivo de análisis
- Git LFS: Gestión de archivos grandes (base de datos 85MB comprimida)
- SQLite: Base de datos relacional (406MB descomprimida)
- Market Basket Analysis: Métricas de Soporte, Confianza y Lift
💡 Aprendizajes Clave
- Escalabilidad: Procesamiento eficiente de 4.9M registros
- Automatización: Descompresión automática para mejor UX
- Git LFS: Manejo profesional de archivos grandes en Git
- Métricas de Asociación: Aplicación práctica de Lift y Confianza
- Interpretación de Negocio: Traducir métricas en acciones comerciales