Se estima que cada minuto al día se envían más de 200 millones de e-mails, se comparten más de 700.000 publicaciones en Facebook, se realizan 2 millones de búsquedas en Google o se editan 100 horas de vídeo en YouTube.
En resumen, en un día se generan más datos de los que han existido en los últimos 20 años.
No hay duda que el Big Data & Data Science es una de las profesiones del futuro, con un aumento del 122 % en la publicación de ofertas de empleo relacionadas directamente con el Big Data.
Es por ello que el Máster en Big Data & Data Science tiene un enfoque totalmente práctico para dar respuesta a la necesidad de las empresas de incorporar profesionales especializados.
Dentro del Máster en Big Data & Data Science aprenderás a utilizar e implementar todas las herramientas necesarias que requiere un Big Data Scientist
Además, aprenderás a utilizar herramientas imprescindibles como Hadoop y Spark, el uso de diferentes bases de datos NoSQL y SQL, así como herramientas para la implementación de machine learning, redes neuronales y deep learning
El Máster en Big Data & Data Science está desarrollado e impartido por expertos de grandes compañías con una destacada trayectoria y experiencia en el campo del Big Data. También contarás con la participación de profesionales mediante masterclass.
Si buscas un Máster en Big Data & Data Science que te dé una visión global de todo el paradigma dentro del Big Data, con un enfoque 100 % práctico, éste es tu máster.
Máster en Big Data & Data Science por la Universitat de Barcelona.
Curso propio diseñado según las directrices del Espacio Europeo de Educación Superior y equivalente a 60 créditos ECTS.
Metodología Online. Adaptada a la disponibilidad de los profesionales en activo.
Orientación profesionalizadora. Actividades basadas en retos profesionales reales
Cuenta con expertos de reconocido prestigio en su ámbito, que te apoyarán personalmente en el proceso de aprendizaje. Foros de interacción con los expertos y con los otros participantes, para que puedas sacar el máximo rendimiento al aprendizaje.
Evaluación continua a través de ejercicios prácticos y proyecto fin de curso tutorizado desde el aula virtual.
El Máster en Big Data & Data Science prepara al alumno para:
El Máster en Big Data & Data Science está dirigido a:
El acceso de estudiantes de otras áreas se considerará en función de su experiencia profesional y formación previa.
1. Herramientas de big data
1.1. Almacenamiento de grandes volúmenes de datos: data mark¸ data lakes¸ definición de big data, SQL, NoSQL y procesamiento escalable: Hadoop, MapReduce y Spark.
1.2. Herramientas en cloud: servicios en la nube. Diferencias entre las IaaS, PAAS, SaaS. Google Cloud, Azure Amazon Web Services.
1.3. Monitorización y control. Control de versiones: Git o SVVN. Ventajas e inconvenientes de utilizar GitHub. Alternativas a GitHub.
1.4. Herramientas de análisis: programación en R y programación en Python.
1.5. Herramientas de visualización: Power BI y Power Query (Microsoft Office Excel), Qlik y Tableau.
2. Fundamentos de Estadística
2.1. Introducción a la Estadística: concepto de Estadística. conceptos básicos: población, muestra, variable estadística ....
2.2. Estadística Descriptiva Unidimensional: Distribución de frecuencias, métodos gráficos, tablas estadísticas. Medidas de posición, dispersión, forma y concentración. Gráficos.
2.3. Estadística Descriptiva Bidimensional: Distribución de frecuencias bidimensionales. Tablas estadísticas de doble entrada. Métodos gráficos..
2.4. Regresión y Correlación: Línea general de regresión. Correlación. Regresión lineal. Correlación entre atributos. Coeficiente Sperman, Kendall y Chi-cuadrado.
2.5. Introducción al Cálculo de Probabilidades: Azar y probabilidad. Definiciones y propiedades. Probabilidad condicionada e independencia. Teorema de Bayes y probabilidad total.
3. Gestión de datos y datos digitales
3.1. Digital data: fuentes de datos externas oficiales (INE, EUROSTAT...).
3.2. Google Analytics. Social anatlytics: Hootsuite, Twitter analytics y Facebook insights.
3.3. Web scrapping. Uso de correo basura.
3.4. Data management. Gobierno de los datos. Ética y leyes.
3.5. Data cooking. Preparación de los datos: selección, transformación y codificación.
3.6. Data discovery: creación de nuevas métricas (KPI, insights), discretización de variables.
3.7. Data quality. Técnicas avanzadas de detección de outliers, valores missing, imputación.
3.8. Muestreo probabilístico, aleatorio, estratificado y sistemático.
4. Técnicas avanzadas de minería de datos
4.1. Análisis multivariante: estimación, contraste de hipótesis e intervalos de confianza.
4.2. Análisis de componentes principales (PCE) y factorial.
4.3. Análisis discriminante: elección de variables (forward, backward¸ stepwise).
4.4. Análisis clúster: algoritmos de clasificación jerárquica y no jerárquica.
5. Técnicas avanzadas de predicción
5.1. Preparación de tablero de modelización. Modelos supervisados vs. modelos no supervisados.
5.2. Técnicas para mejorar un modelo: training validation y cross validation.
5.3. Regresión lineal y regresión logística.
5.4. GLM (modelo lineal general). Ridge y PLS.
5.5. Series temporales.
6. Aprendizaje de técnicas learning
6.1. Classification algorithms: árboles de decisión.
6.2. K-nearest neighbors.
6.3. Modelo probabilístico: Bayes.
6.4. Random forest.
6.5. Boosting.
6.6. Bagging.
6.7. Adaboost.
7. Aprendizaje automático para machine learning
7.1. Redes neuronales (neural networks – NN).
7.2. Support vector machine (SVN).
7.3. Deep learning.
7.4. Técnicas de machine learning en imágenes y videos.
7.5. Modelos de sentimientos (computación sobre texto, redes sociales, etc.).
8. Gestión de proyectos
8.1. Herramientas para la gestión de clúster.
8.2. Validación del modelo: verificación p-values en regresiones; test de bondad de ajuste; R-cuadrado, MSE, BIC, AIC.
8.3. Test discriminate: curva ROC, curva lift, Gini index. Jackknifing y bootrstrapping.
8.4. Diagnóstico de los residuos. Prueba de estabilidad y validación con prueba ciega.
8.5. Implementación del modelo: metodología para garantizar una solución viable.
8.6. Mantenimiento y actualización. Uso del modelo y requerimientos de implementación. Monitorizar el rendimiento y la efectividad de los modelos implementados.
8.7. Aportar análisis que faciliten la toma de decisiones y desarrollos futuros.
8.8. Gestión de proyectos: planificación de un proyecto.
8.9. Metodología agile y metodología scrum.
9. Proyecto Final
Dirección
Sra. Dolores Lorente Muñoz
Profesional con más de quince años de experiencia en el mundo de la analítica, apasionada de la estadística (con diplomatura y grado). Experiencia desarrollando modelos predictivos, descriptivos y cuadros de mando de business intelligence y aplicando técnicas de machine learning en los modelos. Experiencia como docente en data mining en KeepCoding y en IMF International Business School y directora y profesora del programa Just Data Science, impartido en la URJC. Actualmente trabaja como responsable científica de datos desarrollando análisis de modelos, comparativas y puesta en producción, tanto con técnicas estadísticas convencionales como con técnicas de machine learning, obteniendo mejoras en las predicciones y un retorno positivo en los proyectos trabajados.
Cuadro docente
Sr. Ferran Arroyo Vendrell
Profesional con más de ocho años de experiencia como data scientist en grandes compañías como Aegon-Santander o Fidias Actuaris. Actualmente trabaja en AXA en modelos predictivos, cross-selling, fraude y optimización. Conocimiento en modelos tanto descriptivos como predictivos en planes de pensiones. Experiencia en machine learning con un alto conocimiento en la analítica y fuertes conocimientos de estadística. Trabaja tanto con R como con Python para al desarrollo de los modelos. Experiencia como docente en la Universidad de Alcalá, en la asignatura de analítica actuarial, y en la Universidad Europea. Licenciado en Empresariales y en Ciencias Actuariales y Financiaras con el Máster Executive en Data Science por la MBIT School.
Sr. Parfait Atchade Adelomou
Ingeniero Superior de Telecomunicaciones, MBAs, PhD Candidate en Computación cuántica. Director Estratégico de Negocio de Lighthouse Disruptive Innovation Group LLC.
Sr. Ferrán Carrascosa Mallafré
Licenciado en Matemáticas en 2001 en la Universidad de Barcelona, y Técnico en Machine learning, Deep learning y Big data, con experiencia de más de 18 años. Actualmente, es responsable de Data Science en análisis de riesgos para CaixaBank. Como docente, tiene una experiencia de 15 años en diferentes cursos universitarios sobre Computación Estadística Moderna con R, Análisis multivariante, Aplicación de métodos estadísticos a la Ciencia Política y la Administración Pública, o Prácticas desarrolladas en R.
Sra. Lidia Cortés
Licenciada en Ciencias Físicas con más de siete años de experiencia en el mundo de los datos, actualmente trabaja en una multinacional. Amplio conocimiento de diferentes herramientas, así como de las distintas fases de un proyecto business intelligence, con gran experiencia en reporting. Entusiasta en la representación visual de la información, para aportar valor y hacerla más atractiva y entendible. Tiene experiencia en impartición de diferentes formaciones tanto a usuarios finales como a personal técnico en diferentes empresas.
Sr. Miguel Ángel De La Llave Montiel
Más de diez años de experiencia en el mundo de la analítica, responsable del departamento de pricing en AXA, experto en modelización de riesgo crediticio en Barclays y analista de inversiones. Doctorando en Econometría Espacial, actualmente cuenta con dos másteres, Máster en Ciencias Actuariales y Financieras y Máster en Técnicas Cuantitativas, y dos licenciaturas, una en Económicas y otra en Actuariales y Financieras. Experiencia como docente en el Máster de Business Analytics en la Universidad Europea, en la que trabaja actualmente.
José Ángel González Barba
Senior Research Scientist en Symanto y PhD en Ciencias de la Computación por la Universitat Politècnica de València (UPV), con 10 años de experiencia en el Procesamiento del Lenguaje Natural (PLN) y el Deep Learning. Ha impartido asignaturas relacionadas con las Ciencias de la Computación en el grado en Ingeniería Informática de la UPV y de la Universidad Europea, dirigido TFGs en este grado y dado charlas sobre modelado de lenguaje en el máster MIARFID.
Sr. Francisco Manuel Rangel Pardo
Doctor en Inteligencia Artificial por la Universidad Politécnica de Valencia (UPV). Es máster en Tecnologías del Lenguaje, ingeniero informático, y tiene el Grado en Ingeniería Técnica en Telecomunicaciones por la UPV. Trabaja como Head of Product en Symanto.
Sra. Dolores Lorente Muñoz
Profesional con más de quince años de experiencia en el mundo de la analítica, apasionada de la estadística (con diplomatura y grado). Experiencia desarrollando modelos predictivos, descriptivos y cuadros de mando de business intelligence y aplicando técnicas de machine learning en los modelos. Experiencia como docente en data mining en KeepCoding y en IMF International Business School y directora y profesora del programa Just Data Science, impartido en la URJC. Actualmente trabaja como responsable científica de datos desarrollando análisis de modelos, comparativas y puesta en producción, tanto con técnicas estadísticas convencionales como con técnicas de machine learning, obteniendo mejoras en las predicciones y un retorno positivo en los proyectos trabajados.
Sr. Jorge Maestre Martínez
Head Of Agile en VASS, con una experiencia desde 1995 en trabajos web, desea acercar la tecnología a todos, haciéndola más manejable y accesible. Está especialmente interesado en aplicaciones que tengan un profundo impacto social, buscando una sociedad mejor. Fundó Devtopia Coop, una cooperativa de desarrolladores, donde colideró y cogestionó proyectos relacionados con internet y tecnologías emergentes.
Sr. Ignacio Pérez Torres
Gerente y arquitecto big data en Accenture Technology. Entusiasta de la tecnología con más de quince años de experiencia trabajando en proyectos con alto contenido tecnológico para las principales empresas del país y seis años trabajando en proyectos de big data. Cuatro años de experiencia como profesor de big data y cloud computing tanto en instituciones públicas como privadas.
El Máster propuesto tendrá una orientación profesional, para facilitar la incorporación de los estudiantes al mercado laboral, o para permitir el reciclaje de profesionales que ya se encuentran incorporados al mercado de trabajo.
Estas son algunas de las salidas profesionales que te ofrece: