Diferencias entre Pandas y PySpark

Dos de las librerías más utilizadas en el mundo de Python para el procesamiento de datos son Pandas y Pyspark(libreria de Python para spark) con características muy similares entre ellas incluyendo los nombres de algunos métodos o funciones. Generalmente la forma más común para tratar datos provenientes de archivos Excel,

Leer más

Cómo hacer un join entre dos tablas en DAX

Idealmente, podemos hacer modificaciones a las tablas que cargamos a Power BI por medio del editor de Querys. Dentro de estas modificaciones esta el hecho de combinarlas de acuerdo a nuestras necesidades. En algunas ocasiones específicas, hacer modificaciones de este tipo desde el editor no es posible, razón por la

Leer más

Calcular la fecha del último día del mes Power BI

Escenario Se requiere calcular la fecha del último día de cada mes teniendo como base una lista de fechas contenidas en una dimensión de tiempo. Solución Para este escenario contamos con una dimensión de tiempo nombrada “Tiempo” compuesta por una columna de fechas y una columna que indica el mes

Leer más

Cantidad de días entre dos fechas usando M en Power BI

ara calcular la cantidad de días entre dos fechas usando M en Power BI vamos a agregar una nueva columna desde el editor de consultas como se ilustra a continuación. En la ventana que se despliega agregamos la siguiente linea de código en la cual nos valemos de la función

Leer más

Consumiendo datos de SQL Server con Google Dataproc

Antes de iniciar, es necesario que tengas los siguientes insumos listos! Lo primero que vamos a hacer es crear un bucket en Google Cloud en donde almacenaremos los archivos jar que vamos a utilizar En este bucket que yo he llamado test-iwco vamos a crear 2 carpetas que utilizaremos mas adelante. En la carpeta jars debemos

Leer más

Nosotros

Contacto

Bogotá, Colombia
Estados Unidos
[mc4wp_form]