Skip to the content.

Proyecto Final del Curso de Big Data Analytics

Segmentación de Clientes de un e-commerce con Fuzzy C-means en Herramientas Big Data

Equipo: Irpiri Agreda, Carlos Fabbri, Jazmín Wong

Esta es la página principal del proyecto de Segmentación de Clientes de un e-Commerce con Fuzzy C-means. El proyecto consiste en la utilización de dos herramientas distintas de Big Data, MRJob y Spark, para realizar la segmentación de clientes. Se presenta código implementado en Python y PySpark en donde se demuestran preprocesamiento. Luego, la implementación de la técnica se ha elaborado en MRJob. Finalmente, los resultados, presentados con ayuda de gráficos, se encuentran en formato de Python Notebook. El proyecto tiene como objetivo demostrar la viabilidad de implementación de la técnica Fuzzy C-means en la herramienta MRJob y el potencial de Spark como ambiente de preprocesamiento de datos de gran volumen.

El proyecto está separado en varias páginas: Problema, Abordaje, Preprocesamiento, Implementación en MRJob, Resultados y Conclusiones.

Adicionalmente, se elaboró el Machine Learning Canvas y el Big Data Canvas de la solución planteada.

ML Canvas

BD Canvas

Referencias

Además de las fuentes citadas en el archivo de Preprocesamiento y Resultados, también se revisaron: