Bienvenido,
En este repositorio encontrarás algunos notebooks prácticos, principalmente desarrollados en R y Python, con tematicas relacionadas a la ciencia e ingeniería de datos.
Extracción, limpieza y organización de distintas fuentes de información para la creación de gráficos estáticos y dinámicos acerca de la población general en México haciendo énfasis la riqueza cultural de la población indígena en México y la falta de accesos a derechos básicos.
Extracción, limpieza y organización de información para la creación de un análisis multivariante detallado con uso de algoritmos PCA y Factor Analysis.
Ejemplos prácticos de consultas basadas en spark core, spark sql function y spark sql respondiendo a preguntas de negocio.
Generación de modelo de regresión basado en RandomForestRegressor para la predicción de el año de la canción.