Manual Analítica de Datos Con Power BI Intermedio (31!08!2021)
Manual Analítica de Datos Con Power BI Intermedio (31!08!2021)
Manual Analítica de Datos Con Power BI Intermedio (31!08!2021)
Tabla de Contenidos
INTRODUCCIÓN 4
RECOMENDACIONES 5
REQUISITOS TÉCNICOS DEL CURSO 7
OBJETIVOS DEL CURSO 8
OBJETIVO GENERAL: 8
OBJETIVOS ESPECÍFICOS: 8
MARCO TEÓRICO 9
MAPA GENERAL DEL CURSO 11
EVALUACIÓN DIAGNÓSTICA 12
CONEXIÓN A DATOS EXTERNOS Y ETL CON POWER QUERY 13
OBJETIVO DE ESTE MÓDULO 14
EXTRAER DATOS DESDE UN ARCHIVO CSV 15
EXTRAER DATOS DESDE UN ARCHIVO DE TEXTO 15
EXTRAER DATOS DESDE UN ARCHIVO CSV 22
EXTRAER DATOS DESDE LA WEB 25
EXTRAER DATOS DESDE UN ARCHIVO JSON 28
EXTRAER DATOS DESDE UN ARCHIVO ODBC 30
TIPOS DE DATOS 31
Tipos de número 31
Tipos de fecha y hora 33
Tipo de texto 34
Tipo verdadero/falso 34
PERFILADO DE DATOS 35
CALIDAD DE COLUMNAS 36
DISTRIBUCIÓN DE COLUMNAS 37
PERFIL DE COLUMNA 38
FILTRAR POR VALOR 39
COPIA DE DATOS 40
AGRUPAR POR VALOR 40
TRANSFORMACIÓN DE FECHAS 42
ANEXAR CONSULTAS 44
COMBINAR CONSULTAS 46
TRANSPONER TABLAS 49
UNPIVOT (ANULAR DINAMIZACIÓN DE COLUMNAS) 50
RESUMEN DEL MÓDULO 55
AUTOEVALUACIÓN 56
MODELAMIENTO DE DATOS 57
OBJETIVO DE ESTE MÓDULO 58
ENTENDIENDO EL MODELO DE DATOS 59
MODELO JERÁRQUICO 60
MODELO EN RED 60
MODELO ENTIDAD-RELACIÓN 61
SALIR DE LA MENTALIDAD DE TABLA ÚNICA 63
LAS TABLAS EN LOS NEGOCIOS 64
Entidades 64
Atributos 65
Relaciones 66
ESQUEMA DE ESTRELLA 68
NORMALIZACIÓN Y DENORMALIZACIÓN 69
NORMALIZACIÓN 69
DENORMALIZACIÓN 70
TABLA CALENDARIO 71
MÉTODO CALENDARAUTO 71
MÉTODO 1 - FUNCIÓN CALENDAR 72
MÉTODO 2 - FUNCIÓN CALENDAR 73
RESUMEN DEL MÓDULO 80
AUTOEVALUACIÓN 81
RELACIONES ENTRE TABLAS 82
OBJETIVO DE ESTE MÓDULO 83
CONCEPTO DE RELACIÓN 84
¿POR QUÉ ES IMPORTANTE CREAR RELACIONES ENTRE TABLAS? 85
Introducción
La gran mayoría de trabajadores(as) se están adaptando al trabajo a distancia
donde cada día es más común trabajar desde la casa. Hoy esto es evidente
con la cuarentena obligatoria decretada por el Gobierno ha resultado ser un
desafío para muchos, o mejor, para todos. Pero, independiente de este
contexto el teletrabajo, tele formación, teleasistencia serán cada día más
comunes en nuestras actividades diarias.
Dentro de los desafíos que impone la realidad actual está el seguir analizando
los datos que genera una empresa de forma más autónoma, lo que hoy en día
se conoce como el Self Service. Es por esta razón que los trabajadores de todas
las empresas están requiriendo con mayor fuerza una preparación para lograr
presentar reportes.
Dado lo anterior, presentamos este manual de auto instrucción a fin de entregar
al participante las herramientas necesarias para analizar y generar reportes
acordes a las exigencias de toda empresa utilizando uno de los lenguajes más
potente de las herramientas de Microsoft – Dax.
Recomendaciones
Para lograr un uso eficiente de este material y aprovechar el aprendizaje de un tema
tan interesante como es la analítica de datos es que debe tener en cuenta lo siguiente:
Recuerda que solo es el punto de partida y luego puedas reconocer tus logros
en este camino de la capacitación. Posteriormente deberás ir recorriendo el
camino e irás avanzando módulo a módulo adquiriendo más conocimientos y
practicando con las actividades propuestas, de modo tal de internalizar y aplicar
lo que has aprendido en tu entorno laboral y maravillarte de las ventajas del
análisis de datos.
Objetivo General:
• Emplear el lenguaje DAX para la preparación de los datos que se utilizan
en la creación de reportes profesionales para la toma de decisiones
laborales.
Objetivos Específicos:
Marco Teórico
La analítica de negocios incluye el proceso de examinar conjuntos de datos
para extraer conclusiones sobre la información que contienen, lo que se hace
cada vez más con la ayuda de sistemas y software especializados.
Evaluación diagnóstica
3. Cree una columna calculada que permita mostrar el Título del empleado,
su Nombre y su Apellido.
5. Cree una medida que permita determinar sólo las ventas de Nancy Davolio.
Cree la medida dentro de la tabla Empleados.
6. Cree una tabla de calendario a partir de una función DAX. La tabla debe
contener desde la fecha más antigua hasta la más reciente de todo el
modelo. También debe contener el número del mes de cada fecha, el
nombre largo del mes de cada fecha y el año de cada fecha. Llame a esta
tabla CalendarioPrueba.
Unidad 1
Conexión a datos externos y ETL con Power Query
Los archivos de texto o CSV son muy conocidos ya que por muchos datos que
contengan dichos archivos su peso es mínimo, por ende, empresas o páginas
web los usan para que su manipulación sea mucho mejor, pero estos tipos de
archivos necesitan ser llevados a una hoja de cálculo como Excel o a
herramientas de inteligencia de negocios como Power BI para ser procesados,
analizados y graficados.
Este cuadro de dialogo de la carga de datos siempre va a salir, así que durante
el manual siempre le vamos a dar Transformar datos, ya que todo el proceso
ETL se realiza dentro de la interfaz de Power Query. Este cuadro es un paso
muy importante para revisar los datos antes de cargarlos.
Como vemos, en este caso ya tenemos cargados los datos de una forma
tabular, es decir, separado por filas y columnas y cada columna tiene su
respectivo encabezado y el formato adecuado, si es número, texto o fecha.
¿Pero cómo Power Query de manera automática identificó los tipos de datos y
los organizó de la manera correcta?, pues bien, esta es una de las grandes
bondades que posee esta herramienta, la identificación de datos y el
ordenamiento de ellos.
Estos son los pasos aplicados que predeterminadamente realizó Power Query
para organizar los datos. Si hacemos clic en cada uno de ellos va mostrando la
evolución del proceso que realizó Power Query después de haber cargado los
datos, veamos:
Ya en este paso los encabezados tienen el nombre correcto, pero bien todas
las columnas están como formato texto (ABC), lo que se necesita darle el
formato adecuado según el tipo de dato, Power Query de manera automática
crea el tercer paso “Tipo cambiado” y le da el formato que el cree adecuado
para cada columna.
Ahora eliminaremos la columna Bodega, para ese efecto debemos hacer clic
con el botón derecho del mouse sobre la columna y seleccionar la opción
Quitar.
Si quiere dar un nombre más significativo a este paso debe hacer clic con el
botón derecho del mouse y seleccionar la opción Cambiar nombre.
Supongamos que a este paso lo llamaremos eliminar columna bodega.
En el menú Inicio debemos hacer clic en del botón Cerrar y aplicar, deja
los datos en una tabla de Power BI.
En el menú inicio, grupo Reducir filas, seleccione el botón Quitar filas y dentro
de las opciones que muestra seleccionar Quitar filas superiores.
El resultado es el siguiente:
Para sacar la última fila el proceso es el mismo, pero utilizando la opción Quitar
filas inferiores.
Para quitar las filas internas, el proceso puede ser más engorroso por lo que
sugerimos, primero promover los encabezados y luego eliminar los errores que
se generen.
Después de escribir la dirección url del anterior cuadro de diálogo hacer clic en
el botón Aceptar, aparece la ventana que solicita identificar el tipo de conexión:
Los archivos JSON son muy populares dado que su peso es muy bajo lo que
lo hace muy atractivo para manipular datos.
Para cargar un archivo JSON local en Power BI Desktop, lo único que debe
hacer es seleccionar la opción JSON en la selección del conector. Esto iniciará
un explorador de archivos local y le permitirá seleccionar el archivo JSON.
Luego debemos hacer clic sobre el botón resaltado con el circulo rojo. La
ventana quedará como sigue:
Solo nos queda cambiar el nombre de las columnas y Cerrar y aplicar los datos.
Tipos de datos
Tipos de número
Número decimal fijo: tiene una ubicación fija para el separador decimal. El
separador decimal siempre tiene cuatro dígitos a la derecha y permite 19 dígitos
de importancia. El valor más grande que puede representar es
922.337.203.685.477,5807 (positivo o negativo). El tipo de número decimal fijo
es útil en casos donde el redondeo podría producir errores. Cuando se trabaja
con muchos números que tienen valores fraccionarios pequeños, a veces
pueden acumularse y hacer que un número sea ligeramente inferior. Puesto
que se truncan los valores que superan los cuatro dígitos a la derecha del
separador decimal, el tipo de decimal fijo puede ayudarle a evitar estos tipos de
errores. Si está familiarizado con SQL Server, este tipo de datos se
corresponde con un decimal de SQL Server (19.4), o con el tipo de datos de
moneda en Power Pivot.
Nota
El modelo de datos de Power BI Desktop admite valores enteros de 64
bits, pero, dadas las limitaciones de JavaScript, el número más grande
que los objetos visuales pueden expresar con seguridad es el 9 007 199
254 740 991 (2^53-1). Si en su modelo de datos trabaja con números
más grandes, puede reducir el tamaño mediante cálculos antes de
agregarlos a un objeto visual.
Tipo de texto
Tipo verdadero/falso
Perfilado de datos
Las herramientas de generación de perfiles de datos proporcionan formas
nuevas e intuitivas de limpiar, transformar y comprender los datos en el editor
de Power Query. Incluyen:
1. Calidad de columnas
2. Distribución de columnas
3. Perfil de columna
Nota
De forma predeterminada, Power Query realizará esta generación de
perfiles de datos en las primeras 1.000 filas de los datos. Para que
funcione sobre todo el conjunto de cambios, Compruebe la esquina
inferior izquierda de la ventana del editor para cambiar el modo en que
se realiza la generación de perfiles de columna.
Calidad de columnas
La característica de calidad de columna etiqueta los valores en las filas de
tres categorías:
Distribución de columnas
Esta característica proporciona un conjunto de objetos visuales debajo de los
nombres de las columnas que muestran la frecuencia y distribución de los
valores de cada una de las columnas. Los datos de estas visualizaciones se
ordenan en orden descendente a partir del valor con la frecuencia más alta.
Perfil de columna
Esta característica proporciona una visión más detallada de los datos de una
columna. Además del gráfico de distribución de columnas, contiene un gráfico
de estadísticas de columnas. Esta información se muestra debajo de la
sección vista previa de los datos, tal como se muestra en la siguiente imagen.
Copia de datos
En la esquina superior derecha de las secciones estadísticas de columna y
distribución de valores, puede seleccionar el botón de puntos suspensivos (...)
para mostrar un menú contextual para copiar. Selecciónelo para copiar los
datos que se muestran en cualquiera de las secciones en el portapapeles.
Transformación de fechas
Anexar consultas
En muchas ocasiones tenemos información de diferentes fuentes o tablas y
debemos consolidar todos los datos en una sola base, Power Query tiene la
ventaja de trabajar con diferentes consultas a la vez e ir anexando una o
varias tablas debajo de cada una sin importar el tipo de extensión del archivo
o fuente de datos, es decir, si tenemos dos o más consultas con la misma
estructura y solo queremos reunirlas todas en una sola.
Supongamos que tenemos tres archivos CSV que queremos incorporar a una
consulta.
En primer lugar, incorporaremos los tres archivos – Ene2021.cvs;
Feb2021.csv; Mar2021.csv – obteniendo el siguiente resultado:
Aquí tenemos dos opciones, unir las tres consultas dentro de una de ellas o
crear una consulta nueva con las tres consultas anteriores.
Optaremos por esta segunda opción.
Combinar consultas
Esta operación es algo más complicada que la anterior. Combinar, o merge
en inglés, supone fusionar dos tablas, atendiendo a unos criterios
determinados. En esta operación sólo se pueden combinar dos tablas a la
vez, no más.
Para realizar esta operación, se deben seleccionar dos tablas, una columna
coincidente en cada una, que debería tener valores comunes, y un tipo de
combinación. El resultado es una tabla cuyo número de filas depende del tipo
de combinación escogido, y el número de columnas depende de las columnas
de la segunda tabla que queramos añadir, ya que de la primera aparecerán
todas
Aquí tenemos dos opciones, combinar las tres consultas dentro de una de
ellas o crear una consulta nueva con las tres consultas anteriores.
Optaremos por esta segunda opción.
Las columnas que se agregan son las que tienen coincidencias en la primera
columna para cada fila. Para nuestro ejemplo son 10 (ver recuadro verde).
Transponer tablas
Hay tablas que por su estructura deben cambiarse para realizar un análisis
mas claro de sus datos.
Por ejemplo, analicemos la siguiente tabla:
Veamos un ejemplo, suponga que quiere hacer una tabla dinámica con la
venta por año de sus clientes.
El archivo tiene el siguiente aspecto:
Note que los campos disponibles para la tabla dinámica son cada uno de los
años.
Lo que debemos realizar para que este proceso sea mas eficiente es usar una
de las formas normales para arreglar estos datos de forma tal que la tabla
contenga tres campos: Clientes, Año y Ventas.
Sólo nos queda cambiar el nombre de las columnas Atributo → Año y Valor →
Ventas.
Podemos observar que la tabla es mucho más limpia y eficiente al tener tres
campos sobre los cuales se construyó.
Los archivos JSON son muy populares dado que su peso es muy bajo lo que
lo hace muy atractivo para manipular datos.
Autoevaluación
¿Qué es y porque se utilizan los archivos CSV?
Unidad 2
Modelamiento de datos
Esta tabla tiene tres columnas, campos o atributos (i.e. alumno, curso y nota),
y siete filas o registros (o en jerga: “tuplas”)
• Las estructuras de datos de la base: El tipo de los datos que hay en la base
y la forma en que se relacionan.
• Las restricciones de integridad: Un conjunto de condiciones que deben
cumplir los datos para reflejar la realidad deseada.
• Operaciones de manipulación de los datos: típicamente, operaciones de
agregado, borrado, modificación y recuperación de los datos de la base.
Modelo Jerárquico
Modelo en Red
Una base de datos de red es una base de datos conformada por una
colección o set de registros, los cuales están conectados entre sí por medio
de enlaces en una red. El registro es similar al de una entidad como las
empleadas en el modelo relacional.
Modelo Entidad-Relación
En muchas ocasiones se trabaja con una planilla o tabla con todos los datos
que registran transacciones. Lo anterior, implica que la granularidad tiende a
ser excesiva con la consiguiente complicación para realizar un correcto
análisis.
La pregunta por resolver es ¿cuál es el nivel de granularidad adecuado para
mi modelo?
Dado lo anterior, es necesario tener claro el enfoque del modelo para asignar
correctamente los atributos entre las distintas tablas.
Entidades
Las entidades representan cosas u objetos (ya sean reales o abstractos), que
se diferencian claramente entre sí.
Atributos
Producto
Código Color
Nombre Precio
Fabricante
Clave externa o clave foránea: este campo tiene que estar estrictamente
relacionado con la clave primaria de otra entidad, para así exigir que exista
Relaciones
Es un vínculo que nos permite definir una dependencia entre varias entidades,
es decir, nos permite exigir que varias entidades compartan ciertos atributos
de forma indispensable.
Por ejemplo, los productos del almacén (en la entidad "Producto") tiene un
código que lo clasifica en una categoría (según la entidad "Subcategoría").
Es decir, un atributo de la entidad "Producto" definirá qué subcategoría tiene
en el almacén, y tiene que ser exactamente igual al que ya existe en la
entidad "SubCategoría".
Tipos de relaciones.
Esquema de estrella
suele llamar cubos. Las tablas de dimensiones definen como están los datos
organizados lógicamente y proveen el medio para analizar el contexto del
negocio. Por ejemplo:
- Describen entidades de negocio,
- Atributos de tablas de Hechos,
- Tablas de Calendario,
- Nombre del Producto,
- Entre otras.
Normalización y Denormalización
Normalización
- Orientada a servidores
- Relaciones complejas entre tablas
- Procesamiento rápido de transacciones
- Elimina redundancia de datos
Denormalización
- Orientado a humanos
- Relaciones simples
- Velocidad de respuesta de usuario
- Usa redundancia para simplificar
Tabla Calendario
Método Calendarauto
Calendario = CALENDAR(StarDay,EndDay)
8. Pero aún tenemos un error porque en todos los años muestra el mismo
valor. Para solucionar esto debemos relacionar la tabla Calendario2 al
modelo. Esto lo hacemos vinculando el campo Fecha_calendario de la
tabla Calendario2 con el campo FechaPedido de la tabla Pedidos.
Una base de datos de red es una base de datos conformada por una colección o set de
registros, los cuales están conectados entre sí por medio de enlaces en una red. El registro
es similar al de una entidad como las empleadas en el modelo relacional.
Clave externa o clave foránea: este campo tiene que estar estrictamente relacionado con
la clave primaria de otra entidad, para así exigir que exista
previamente ese clave.
Relación es un vínculo que nos permite definir una dependencia entre varias entidades, es
decir, nos permite exigir que varias entidades compartan ciertos atributos de forma
indispensable.
Relación Uno a uno: Una entidad se relaciona únicamente con otra y viceversa. Por
ejemplo, si tuviésemos una entidad con distintos chasis y otra con matrículas deberíamos
de determinar que cada chasis solo puede tener una matrícula (y cada matrícula un chasis,
ni más en ningún caso).
Relación Uno a varios o varios a uno: determina que un registro de una entidad puede
estar relacionado con varios de otra entidad, pero en esta entidad existir solo una vez. Como
ha sido en el caso anterior del trabajador del taller.
Autoevaluación
¿Qué es un modelo de datos?
Unidad 3
Relaciones entre tablas
Concepto de relación
Las relaciones de Power BI, propagan el filtro que se aplica en las columnas de las
tablas de un modelo hacia otras tablas, usando la dirección definida en dicha
relación, sin embargo, esta relación puede deshabilitarse o se puede modificar el
contexto de filtro utilizando funciones DAX.
Para inactivar una relación debemos hacer clic con el botón derecho del
mouse en la línea de la relación y se selecciona Propiedades. Aparece la siguiente
ventana:
Como hemos visto en este curso las tablas se relacionan a través de las relaciones.
Estas predeterminadamente son activas, pero no pueden existir más de una relación
activa entre dos tablas.
En caso de necesitar más de una relación entre dos tablas tenemos que usar
relaciones inactivas.
Primero veamos lo que pasa al construir un objeto visual Tabla con la relación
inactiva:
Podemos observar que hay algo que es poco usual dado que todos los
clientes presentan el mismo monto, 52.
Este monto corresponde al total de todos los tiempos de delivery de los
clientes.
Una fila en blanco nos indica que nuestra integridad referencial del modelo no
se está cumpliendo.
Nota. Esta función no se puede utilizar para devolver valores a una celda o
columna en una hoja de trabajo; más bien, lo usa como una función
intermedia, anidada en una fórmula, para obtener una lista de valores distintos
que se pueden contar o usar para filtrar o sumar otros valores.
Sintaxis
VALUES(<TableNameOrColumnName>)
Parámetros
Término Definición
Nombre de Una columna desde la que se devolverán valores
tabla o nombre únicos o una tabla desde la que se devolverán filas.
de columna
Devuelve una tabla de una columna que contiene los valores distintos de la
columna especificada. En otras palabras, los valores duplicados se eliminan y
solo se devuelven valores únicos.
Nota. Esta función no se puede utilizar para devolver valores a una celda o
columna en una hoja de trabajo; más bien, anida la función DISTINCT dentro
de una fórmula, para obtener una lista de valores distintos que se pueden
pasar a otra función y luego contar, sumar o usar para otras operaciones.
Sintaxis
DISTINCT(<column>)
Parámetros
Término Definición
Columna La columna desde la que se devolverán valores únicos. O una
expresión que devuelve una columna.
Vamos crear una medida que cuente el número de cursos de dicha tabla pero
ahora utilizando la función Distinct.
Filtro bidireccional
Esta medida permite chequear que en la tabla ventas está vacío. La función NOT e
INT permiten llevar este resultado a 1 o 0.
En caso de necesitar más de una relación entre dos tablas tenemos que usar relaciones
inactivas. Estas relaciones se activan utilizando la función Userelationship.
La función Distinct devuelve una tabla de una columna que contiene los valores distintos
de la columna especificada.
Autoevaluación
¿Por qué Power BI detecta automáticamente las relaciones?
¿Qué pasa cuando entre dos tablas existen más de una relación?
Unidad 4
Tablas virtuales en DAX
La función Summarize
Es una de las funciones más utilizada para resumir y agregar datos al modelo.
ADDCOLUMNS Y SUMMARIZE
La combinación de estas dos funciones nos permite manejar la granularidad
de una tabla a fin de crear cálculos resumidos con tablas virtuales.
Para entender esta tabla tomaremos el valor promedio del año 2021 y lo
revisaremos en la planilla Excel. En esta podemos observar de donde se
obtuvo este valor:
CalculateTable
La función CALCULATETABLE evalúa una expresión que genera una tabla
en un contexto modificado por los filtros cedidos como argumentos.
Sintaxis
Parámetros
Término Definición
expresión La expresión de la tabla que se va a evaluar.
filter1, filter2,… (Opcional) Expresiones booleanas o expresiones de tabla que
definen filtros o funciones modificadoras de filtros.
La expresión utilizada como primer parámetro debe ser una tabla modelo o
una función que devuelva una tabla.
Los filtros pueden ser:
• Expresiones de filtro booleano
• Expresiones de filtro de tabla
• Funciones de modificación de filtros
Cuando hay varios filtros, se evalúan mediante el operador lógico AND. Eso
significa que todas las condiciones deben ser VERDADERAS al mismo
tiempo.
Valor devuelto
Una tabla de valores.
Veamos un ejemplo:
Crearemos una tabla que muestre las ventas totales para el producto Office.
Podemos observar que esta segunda forma de crear la tabla es mas simple dado
que CalculateTable realiza la misma función que Filter más Related.
Veamos un ejemplo, vamos a generar una tabla con la Descripción del curso,
el total de cursos.
Se genera un error que nos indica que debemos utilizar una función de
agregación. Este es por la primera consideración.
Corrijamos esto:
Si ahora hacemos una doble agregación con GroupBy para obtener el total de
cantidad de cursos debemos generar la siguiente estructura que nos
entregará un valor escalar.
Funciones de Agregado
DAX incluye funciones de agregación con las que puede especificar una tabla
donde se efectuará la agregación. Por lo tanto, en lugar de calcular
simplemente la suma o el promedio de los valores de una columna, estas
funciones permiten crear una expresión que define dinámicamente los datos
que se agregarán.
AVERAGEX,
Calcula el promedio de un conjunto de expresiones evaluado en una tabla.
AVERAGEX(<table>,<expression>)
COUNTAX,
Cuenta el promedio de un conjunto de expresiones evaluado en una tabla.
COUNTAX(<table>,<expression>)
COUNTX,
Cuenta el número total de filas de una tabla.
COUNTX(<table>,<expression>)
SUMX,
Devuelve la suma de una expresión evaluada para cada fila de una tabla.
SUMX(<table>, <expression>)
Funciones Lógicas
Las funciones lógicas actúan sobre una expresión para devolver información
sobre los valores o conjuntos en la expresión. Por ejemplo, puede usar la
función SI para verificar el resultado de una expresión y crear resultados
condicionales.
Y,
Comprueba si ambos argumentos son VERDADEROS y devuelve
VERDADERO si ambos argumentos son VERDADEROS.
AND(<logical1>;<logical2>)
FALSE,
Comprueba si ambos argumentos son VERDADEROS y devuelve
VERDADERO si ambos argumentos son VERDADEROS.
FALSE()
IF,
Comprueba una condición y devuelve un valor cuando es VERDADERO;
de lo contrario, devuelve un segundo valor.
IFERROR,
Evalúa una expresión y devuelve un valor especificado si la expresión
devuelve un error.
IFERROR(value; value_if_error)
NOT,
Cambia FALSO a VERDADERO o VERDADERO a FALSO.
NOT(<logical>)
TRUE,
Devuelve el valor lógico VERDADERO.
TRUE()
Funciones de Información
Las funciones de información DAX observan la celda o fila que se proporciona
como argumento y le indica si el valor coincide con el tipo esperado. Por
ejemplo, la función ISERROR devuelve VERDADERO si el valor al que hace
referencia contiene un error.
CONTAINS,
Devuelve verdadero si los valores para todas las columnas referidas
existen, o están contenidos, en esas columnas; de lo contrario, la función
devuelve falso.
ISBLANK,
Comprueba si un valor está en blanco y devuelve VERDADERO o FALSO.
ISBLANK(<value>)
ISEMPTY,
Comprueba si una mesa está vacía.
ISEMPTY(<table_expression>)
ISERROR,
Comprueba si un valor es un error y devuelve VERDADERO o FALSO.
ISERROR(<value>)
ISNUMBER,
Comprueba si un valor es un número y devuelve VERDADERO o FALSO.
ISNUMBER(<value>)
ISNUMBER,
Compru
eba si un valor es texto y devuelve VERDADERO o FALSO.
ISTEXT(<value>)
Funciones Matemáticas
Las funciones matemáticas en Expresiones de análisis de datos (DAX) son
muy similares a las funciones matemáticas y trigonométricas de Excel. Esta
sección enumera las funciones matemáticas proporcionadas por DAX.
CURRENCY,
Evalúa el argumento y devuelve el resultado como tipo de datos de moneda.
CURRENCY(<value>)
DIVIDE,
Realiza la división y devuelve el resultado alternativo o BLANK () en la
división por 0.
DIVIDE(<numerator>, <denominator>
[,<alternateresult>])
INT,
Comprueba si un valor es texto y devuelve VERDADERO o FALSO.
INT(<number>)
ROUND,
Redondea un número al número de dígitos especificado.
ROUND(<number>, <num_digits>)
ROUNDOWN,
Redondea un número hacia abajo, hacia cero.
ROUNDDOWN(<number>, <num_digits>)
ROUNDUP,
Redondea un número hacia arriba, lejos de 0 (cero).
ROUNDUP(<number>, <num_digits>)
SUM,
Agrega todos los números en una columna.
SUM(<column>)
SUMX,
Devuelve la suma de una expresión evaluada para cada fila de una tabla.
SUMX(<table>, <expression>)
TRUNC,
Trunca un número a un entero eliminando la parte decimal o fraccionaria
del número.
TRUNC(<number>,<num_digits>)
Funciones de Texto
Data Analysis Expressions (DAX) incluye un conjunto de funciones de texto
basadas en la biblioteca de funciones de cadena en Excel, pero que se han
modificado para trabajar con tablas y columnas en modelos tabulares. Esta
sección describe las funciones de texto disponibles en el lenguaje DAX.
CONCATENATE,
Une dos cadenas de texto en una cadena de texto.
CONCATENATE(<text1>, <text2>)
FORMAT,
Convierte un valor en texto de acuerdo con el formato especificado.
FORMAT(<value>, <format_string>)
LEFT,
Devuelve el número especificado de caracteres desde el inicio de una
cadena de texto.
LEFT(<text>, <num_chars>)
RIGHT,
DERECHA devuelve el último carácter o caracteres en una cadena de texto,
en función del número de caracteres que especifique.
RIGHT(<text>, <num_chars>)
VALUE,
Convierte una cadena de texto que representa un número en un número.
VALUE(<text>)
CALENDAR,
Devuelve una tabla con una sola columna llamada "Fecha" que contiene un
conjunto contiguo de fechas.
CALENDAR(<start_date>, <end_date>)
CALENDARAUTO,
Devuelve una tabla con una sola columna llamada "Fecha" que contiene un
conjunto contiguo de fechas.
CALENDARAUTO([fiscal_year_end_month])
DATE,
Devuelve la fecha especificada en formato de fecha y hora.
DATEDIFF,
Devuelve el recuento de límites de intervalo cruzados entre dos fechas.
MONTH,
Devuelve el mes como un número del 1 (enero) al 12 (diciembre).
MONTH(<datetime>)
QUARTER,
Devuelve el trimestre como un número del 1 al 4.
QUARTER(<date>)
YEAR,
Devuelve el año de una fecha como un entero de cuatro dígitos en el rango
1900-9999.
YEAR(<date>)
Funciones Relacionales
Las funciones en esta categoría son para administrar y utilizar las relaciones
entre tablas.
CROSSFILTER,
Especifica la dirección de filtrado cruzado que se utilizará en un cálculo para
una relación que existe entre dos columnas.
CROSSFILTER(<columnName1>, <columnName2>,
<direction>)
RELATED,
Devuelve un valor relacionado de otra tabla.
RELATED(<column>)
RELATEDTABLE,
Evalúa una expresión de tabla en un contexto modificado por los filtros
dados.
RELATEDTABLE(<tableName>)
USERRELATIONSHIP,
Especifica la relación que se utilizará en un cálculo específico como el que
existe entre columnName1 y columnName2.
USERELATIONSHIP(<columnName1>,<columnName2>)
Funciones de Conversión
DATEADD,
Devuelve una tabla que contiene una columna de fechas, desplazada hacia
adelante o hacia atrás en el tiempo por el número especificado de intervalos
desde las fechas en el contexto actual.
DATEADD(<dates>,<number_of_intervals>,<interval>)
DATESBETWEEN,
Devuelve una tabla que contiene una columna de fechas que comienza con
una fecha de inicio especificada y continúa hasta una fecha de finalización
especificada.
LASTDATE,
Devuelve la última fecha en el contexto actual para la columna de fechas
especificada.
LASTDATE(<dates>)
PARALLERPERIOD,
Devuelve una tabla que contiene una columna de fechas que representa un
período paralelo a las fechas en la columna de fechas especificadas, en el
contexto actual, con las fechas desplazadas una cantidad de intervalos ya
sea hacia adelante o hacia atrás en el tiempo.
PARALLELPERIOD(<dates>,<number_of_intervals>,<interva
l>)
PREVIOUSYEAR,
Devuelve una tabla que contiene una columna de todas las fechas del año
anterior, dada la última fecha en la columna de fechas, en el contexto actual.
PREVIOUSYEAR(<dates>[,<year_end_date>])
SAMEPERIODLASTYEAR,
Devuelve una tabla que contiene una columna de fechas desplazadas un
año atrás de las fechas en la columna de fechas especificadas, en el
contexto actual.
SAMEPERIODLASTYEAR(<dates>)
Autoevaluación
¿Cuál es la utilidad de la función Summarize?
Evaluación Final
3. Cree una columna calculada que permita mostrar el Título del empleado,
su Nombre y su Apellido.
5. Cree una medida que permita determinar sólo las ventas de Nancy Davolio.
Cree la medida dentro de la tabla Empleados.
6. Cree una tabla de calendario a partir de una función DAX. La tabla debe
contener desde la fecha más antigua hasta la más reciente de todo el
modelo. También debe contener el número del mes de cada fecha, el
nombre largo del mes de cada fecha y el año de cada fecha. Llame a esta
tabla CalendarioPrueba.
Glosario
A
Agregados Cuando los valores de varias filas se agrupan como entrada en criterios
para formar un valor único de significado o medición más significativo.
Anotar Para escribir líneas, texto o sellos en una copia instantánea de un mosaico,
informe o visual en la aplicación móvil Power BI para dispositivos iOS y Android.
ArcGIS for Power BI ArcGIS es una plataforma de mapeo y análisis creada por la
empresa ESRI. El nombre de la imagen visual incluida en la biblioteca de imágenes
de Power BI se llama ArcGIS for Power BI.
B
BI, inteligencia de negocios
C
Cálculo Una determinación matemática del tamaño o número de algo.
Variable continua: una variable continua puede ser cualquier valor entre sus
límites mínimo y máximo; de lo contrario, es una variable discreta. Ejemplos son
temperatura, peso, edad y tiempo. Las variables continuas pueden incluir fracciones
o porciones del valor. El número total de patinetas azules vendidas es una variable
discreta ya que no podemos vender la mitad de una patineta.
D
Tablero Una selección de elementos visuales que comunican el estado y las
métricas. Un tablero de instrumentos organiza y presenta los datos de una manera
fácil de entender.
Flujo De Datos Los flujos de datos ingieren, transforman, integran y enriquecen big
data definiendo conexiones de origen de datos, lógica ETL, horarios de
actualización y más. Anteriormente grupo de datos.
Dimensión: las dimensiones son datos categóricos (texto). Una dimensión describe
una persona, objeto, artículo, productos, lugar y tiempo. En un conjunto de datos,
las dimensiones son una forma de agrupar medidas en categorías útiles. Para
nuestra compañía de patinetas, algunas dimensiones pueden incluir mirar las
ventas (una medida) por modelo, color, país o campaña de marketing.
E
Vista de edición El modo en el que los diseñadores de informes pueden explorar,
diseñar, crear y compartir un informe.
Entorno [Power BI Desktop, Power BI Mobile, el servicio Power BI, etc.] Otra forma
de referirse a una de las herramientas de Power BI. Está bien usar el entorno Power
BI (inquilino) en la documentación donde puede ayudar a los analistas de negocios
que están familiarizados con el término inquilino a saber que es lo mismo.
F
Filtro versus resaltado Un filtro elimina datos que no se aplican. Un resaltado
atenúa los datos que no se aplican.
Modo de enfoque Use el modo de enfoque para desplegar una imagen o mosaico
para ver más detalles. Todavía puede interactuar con el visual o el mosaico
mientras está en modo de enfoque.
G
Gateways o gateways de datos locales Un puente a las fuentes de datos
subyacentes. Proporciona una transferencia de datos rápida y segura entre el
servicio Power BI y las fuentes de datos locales que admiten la actualización.
Generalmente administrado por TI.
H
Inicio La edad de aterrizaje predeterminada para los usuarios del servicio Power
BI. No modifica nada. Puede llamarse Power BI Home o simplemente Home.
K
KPI Indicadores clave de rendimiento. Un tipo de visual.
L
Navegación izquierda (navegación izquierda) Se ha reemplazado con el panel
de navegación, pero aún puede aparecer en alguna documentación.
Los controles a lo largo del borde izquierdo del servicio Power BI.
Se asigna una licencia a un usuario y puede ser una licencia gratuita o Pro.
Dependiendo de cómo se adquirió la licencia, puede ser paga o no. Las cuentas
son: por usuario u organización. Las cuentas por usuario están disponibles como
gratuitas o Pro. Un usuario libre de Power BI está utilizando Power BI Desktop
independiente o está utilizando el servicio Power BI de forma independiente o está
utilizando el servicio Power BI dentro de una organización que tiene una suscripción
organizativa Premium. La cuenta Pro por usuario de Power BI es una suscripción
mensual paga que permite la colaboración y el intercambio de contenido con otros
usuarios Pro.
M
Medida: una medida es un campo cuantitativo (numérico) que se puede usar para
hacer cálculos. Los cálculos comunes son suma, promedio y mínimo. Por ejemplo,
si nuestra empresa fabrica y vende patinetas, nuestras medidas podrían ser la
cantidad de patinetas vendidas y el beneficio promedio por año.
Modelado [Power BI Desktop] Obteniendo los datos a los que está conectado listos
para usar en Power BI. Esto incluye crear relaciones entre tablas en múltiples
fuentes de datos, crear medidas y asignar métricas.
Mi espacio de trabajo El espacio de trabajo que debe utilizar cada cliente de Power
BI para crear contenido. Si quieren agrupar todo lo creado aquí en una aplicación y
tienen permisos de diseñador, lo cargan en el espacio de trabajo apropiado o crean
uno nuevo.
P
Páginas. Cada pestaña en el lienzo del informe representa una página.
Power BI Pro Una licencia mensual por usuario que brinda la capacidad de crear
informes y paneles de control, colaborar en datos compartidos, mantener los datos
actualizados automáticamente, auditar y controlar cómo se accede y utiliza los
datos, y la capacidad de empaquetar contenido para distribuirlo (Aplicaciones de
Power BI). Ver cuenta.
Q
Q&A La capacidad de escribir preguntas en lenguaje natural sobre un conjunto de
datos y obtener respuestas en forma de visualizaciones. Aparece en el servicio
Power BI y el escritorio.
R
Vista de lectura Vista de solo lectura para informes (a diferencia de la Vista de
edición).
Reporte
Una vista de múltiples perspectivas en un único conjunto de datos, con
visualizaciones que representan diferentes hallazgos e ideas de ese conjunto de
datos. Puede tener una sola visualización o muchas, una sola página o muchas
páginas.
S
SaaS
El software como servicio (o SaaS) es una forma de entregar aplicaciones a través
de Internet, como un servicio basado en la web. También conocido como: software
basado en web, software a pedido o software alojado.
T
Tiles Los paneles de Power BI contienen mosaicos de informes.
Series temporales: una serie temporal es una forma de mostrar el tiempo como
puntos de datos sucesivos. Esos puntos de datos pueden ser incrementos como
segundos, horas, meses o años.
V
Valor, valores Datos numéricos a visualizar.
W
Libro de trabajo Un libro de Excel para ser utilizado como fuente de datos. Los
libros de trabajo pueden contener un modelo de datos con una o más tablas de
datos cargadas utilizando tablas vinculadas, Power Query o Power Pivot.
X
eje x
El eje a lo largo de la parte inferior, el eje horizontal.
Y
eje y El eje a lo largo del lado, el eje vertical.