José Luis Ferrete

Full Stack Developer

Web Designer

Blogger

Freelancer

José Luis Ferrete

Full Stack Developer

Web Designer

Blogger

Freelancer

Mes: julio 2023

julio 21, 2023 The best way to use one-to-one table relationships

Las relaciones de tabla uno a uno se utilizan para separar datos que no cambian al mismo tiempo. Esto proporciona una mejor concurrencia, menos bloqueos y más bloqueos optimistas, mejores resultados de caché y una mejor integridad de datos.

julio 20, 2023 Introduction to Spark and PySpark: Unlocking Big Data Processing Power

Spark y PySpark son frameworks de procesamiento de big data que permiten el procesamiento distribuido de grandes volúmenes de datos. Spark ofrece capacidades de procesamiento en memoria y tolerancia a fallos, mientras que PySpark permite a los desarrolladores de Python aprovechar el poder de Spark sin cambiar de lenguaje. Juntos, ofrecen una plataforma flexible y potente para el procesamiento distribuido de big data.

julio 18, 2023 Scripting PySpark Dataframes

El artículo habla sobre cómo generar scripts en Python para reproducir y transportar dataframes en PySpark. Estos scripts contienen tanto los datos como el esquema del dataframe y pueden ser editados según sea necesario. Esto es útil para depurar problemas en entornos de desarrollo, crear pruebas unitarias y generar datos de muestra. Además, se menciona que los archivos parquet son eficientes pero difíciles de editar, mientras que los scripts de dataframe pueden ser modificados fácilmente.