En la era de la información, los datos se han convertido en un activo invaluable para las empresas y organizaciones de todo tipo. La capacidad de recopilar, analizar e interpretar estos datos puede ser la diferencia entre el éxito y el fracaso.

El Diplomado en Ciencia de Datos te brindará las habilidades y conocimientos necesarios para convertirte en un profesional capaz de aprovechar el poder de los datos para tomar decisiones estratégicas y mejorar el rendimiento de cualquier organización.

Se busca que al finalizar el diplomado, se obtenga habilidades y competencias para Identificar oportunidades para aplicar la ciencia de datos en diferentes áreas. Seleccionar las herramientas y técnicas adecuadas para cada proyecto. Realizar análisis de datos complejos de forma eficiente y precisa. Comunicar los resultados de tus análisis de forma clara y concisa.

Objetivos:

Conocer los fundamentos teóricos y aspectos tecnológicos asociados a la Ciencia de los Datos

Utilizar métodos y herramientas para el análisis y procesamiento de grandes volúmenes de datos.

Desarrollar proyectos de ciencia de datos para solucionar problemas. Las herramientas sugeridas son nltk, scipy, pandas, matplotlib y librerías de Python.

Perfil del estudiante:

Profesionales que buscan adquirir nuevas competencias en el campo de la ciencia de datos.

Entusiastas y personas con competencias básicas en programación y comprensión básica de repositorios y bases de datos.

Personas que buscan mejorar sus oportunidades laborales en un mercado cada vez más demandante de habilidades analíticas.

Módulo 1: Introducción a la Ciencia de Datos (24 horas) prof. Carlos Acosta

  • Concepto y ciclo de vida de la ciencia de datos.
  • Habilidades y herramientas básicas para el científico de datos.
  • Ética y responsabilidad en el uso de datos.

Módulo 2: Recopilación y limpieza de datos (24 horas) Prof. Andres Sanoja

  • Introducción a las fuentes de datos.
  • Calidad de Datos
  • Técnicas de extracción, transformación y carga de datos.
  • Limpieza y tratamiento de datos incompletos o inconsistentes.

Módulo 3: Análisis de datos (24 horas) Prof. Paul Quijada

  • Estadística descriptiva e inferencial.
  • Análisis de regresión lineal y logística.
  • Probabilidad Condicional
  • Teorema de Bayes. Clasificación Bayesiana.

Módulo 4: Algoritmos en Ciencia de Datos Prof. Andres Sanoja

  • Técnicas de minería de datos.
  • Estudio y uso de algoritmos específicos para la ciencia de datos
    • Aprendizaje supervisado: regresión y clasificación bayesiana
    • Aprendizaje no supervisado: reglas de asociación, agrupación.

Módulo 5: Visualización de datos (24 horas) Profa. Tina Di Vasta

  • Principios de la visualización de datos.
  • Herramientas para la creación de gráficos y dashboards con Excel.
  • Comunicación efectiva de resultados a través de visualizaciones.

Módulo 6: Proyectos de ciencia de datos (24 horas) (Prof. Andres Sanoja)

  • Desarrollo de un proyecto práctico de aplicación de la ciencia de datos a un problema real. Las herramientas sugeridas son nltkscipypandasmatplotlib y librerías de Python.
  • Presentación y defensa del proyecto ante un panel de expertos.

DocenteDr. Andrés Sanoja – Director de la Escuela de Computación de la UCV

Correo Electrónico: asanoja.pro@gmail.com

Teléfono: (0212) 6051042 / 6051633