
En la era de la información, los datos se han convertido en un activo invaluable para las empresas y organizaciones de todo tipo. La capacidad de recopilar, analizar e interpretar estos datos puede ser la diferencia entre el éxito y el fracaso.
El Diplomado en Ciencia de Datos te brindará las habilidades y conocimientos necesarios para convertirte en un profesional capaz de aprovechar el poder de los datos para tomar decisiones estratégicas y mejorar el rendimiento de cualquier organización.
Se busca que al finalizar el diplomado, se obtenga habilidades y competencias para Identificar oportunidades para aplicar la ciencia de datos en diferentes áreas. Seleccionar las herramientas y técnicas adecuadas para cada proyecto. Realizar análisis de datos complejos de forma eficiente y precisa. Comunicar los resultados de tus análisis de forma clara y concisa.
Objetivos:
Conocer los fundamentos teóricos y aspectos tecnológicos asociados a la Ciencia de los Datos
Utilizar métodos y herramientas para el análisis y procesamiento de grandes volúmenes de datos.
Desarrollar proyectos de ciencia de datos para solucionar problemas. Las herramientas sugeridas son nltk, scipy, pandas, matplotlib y librerías de Python.
Perfil del estudiante:
Profesionales que buscan adquirir nuevas competencias en el campo de la ciencia de datos.
Entusiastas y personas con competencias básicas en programación y comprensión básica de repositorios y bases de datos.
Personas que buscan mejorar sus oportunidades laborales en un mercado cada vez más demandante de habilidades analíticas.
Módulo 1: Introducción a la Ciencia de Datos (24 horas) prof. Carlos Acosta
- Concepto y ciclo de vida de la ciencia de datos.
- Habilidades y herramientas básicas para el científico de datos.
- Ética y responsabilidad en el uso de datos.
Módulo 2: Recopilación y limpieza de datos (24 horas) Prof. Andres Sanoja
- Introducción a las fuentes de datos.
- Calidad de Datos
- Técnicas de extracción, transformación y carga de datos.
- Limpieza y tratamiento de datos incompletos o inconsistentes.
Módulo 3: Análisis de datos (24 horas) Prof. Paul Quijada
- Estadística descriptiva e inferencial.
- Análisis de regresión lineal y logística.
- Probabilidad Condicional
- Teorema de Bayes. Clasificación Bayesiana.
Módulo 4: Algoritmos en Ciencia de Datos Prof. Andres Sanoja
- Técnicas de minería de datos.
- Estudio y uso de algoritmos específicos para la ciencia de datos
- Aprendizaje supervisado: regresión y clasificación bayesiana
- Aprendizaje no supervisado: reglas de asociación, agrupación.
Módulo 5: Visualización de datos (24 horas) Profa. Tina Di Vasta
- Principios de la visualización de datos.
- Herramientas para la creación de gráficos y dashboards con Excel.
- Comunicación efectiva de resultados a través de visualizaciones.
Módulo 6: Proyectos de ciencia de datos (24 horas) (Prof. Andres Sanoja)
- Desarrollo de un proyecto práctico de aplicación de la ciencia de datos a un problema real. Las herramientas sugeridas son nltk, scipy, pandas, matplotlib y librerías de Python.
- Presentación y defensa del proyecto ante un panel de expertos.
Docente: Dr. Andrés Sanoja – Director de la Escuela de Computación de la UCV
Correo Electrónico: asanoja.pro@gmail.com
Teléfono: (0212) 6051042 / 6051633