Introducción a PySpark

IntermedioNivel de habilidad

Actualizado 9/2025

Domina PySpark para manejar big data con facilidad: ¡aprende a procesar, consultar y optimizar conjuntos de datos masivos para realizar potentes análisis!

Crea Tu Cuenta Gratuita

Al continuar, aceptas nuestros Términos de uso, nuestra Política de privacidad y que tus datos se almacenen en los EE. UU.

Descripción del curso

Este curso es perfecto para ingenieros de datos, científicos de datos y profesionales del machine learning que desean trabajar con grandes conjuntos de datos de manera eficiente. Tanto si estás pasando de herramientas como Pandas como si te estás iniciando en las tecnologías de big data por primera vez, este curso ofrece una sólida introducción a PySpark y al procesamiento distribuido de datos.

¿Por qué Spark? ¿Por qué ahora?

Descubre la velocidad y la escalabilidad de Apache Spark, el potente marco diseñado para gestionar grandes volúmenes de datos. A través de lecciones interactivas y ejercicios prácticos, verás cómo el procesamiento en memoria de Spark le da una ventaja sobre los marcos tradicionales como Hadoop. Comenzarás configurando sesiones de Spark y profundizarás en componentes básicos como los conjuntos de datos distribuidos resilientes (RDD) y los DataFrame. Aprende a filtrar, agrupar y unir conjuntos de datos con facilidad mientras trabajas con ejemplos del mundo real.

Mejora tus habilidades en Python y SQL para el big data

Aprende a utilizar PySpark SQL para consultar y gestionar datos utilizando la sintaxis SQL habitual. Aborda esquemas, tipos de datos complejos y funciones definidas por el usuario (UDF), al tiempo que desarrollas habilidades en el almacenamiento en caché y la optimización del rendimiento para sistemas distribuidos.

Construye tus bases de big data

Al finalizar este curso, tendrás la confianza necesaria para manejar, consultar y procesar grandes volúmenes de datos utilizando PySpark. Con estas habilidades básicas, estarás listo para explorar temas avanzados como machine learning y el análisis de big data.

Prerrequisitos

Introduction to SQL Data Manipulation with pandas

Introducción a Apache Spark y PySpark

Descripción del curso

¿Por qué Spark? ¿Por qué ahora?

Mejora tus habilidades en Python y SQL para el big data

Construye tus bases de big data

Obtener certificado de logros

Únete a más .css-nklxlk{color:var(--wf-brand--main, #03EF62);}18 millones de estudiantes y empezar Introducción a PySpark hoy

Crea Tu Cuenta Gratuita

Únete a más 18 millones de estudiantes y empezar Introducción a PySpark hoy