100% encontró este documento útil (1 voto)

392 vistas20 páginas

MongoDB - Agregando

Este documento explica cómo agregar y resumir datos en MongoDB usando operaciones de agregación. Describe las diferentes etapas de agregación como $group, $match, $project y funciones como $sum, $avg, $addToSet. También muestra ejemplos de cómo calcular totales, promedios y otros valores resumidos de los datos.

Cargado por

Carlos Marin

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

100% encontró este documento útil (1 voto)

392 vistas20 páginas

MongoDB - Agregando

Cargado por

Carlos Marin

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Está en la página 1/ 20

17/5/2020 MongoDB - Agregando

Bases de Datos NoSQL - RafaC - 2016/2017

En las bases de datos es muy importante disponer de consultas que permitan combinar diferentes elementos; por
ejemplo dada la colección de ventas en una tienda calcular el total vendido; o incluso los subtotales logrados por cada
vendedor.

Índice
Estructura
$group
Funciones de agregación
$sum
$avg
$addToSet
$push
$unwind
$max, $min
$first, $last
$bucket y $bucketAuto
$facet
$project
$match
$sort
$skip, $limit
Etapas
$out
$lookup
Map Reduce
Vistas
Enlaces
A esta misma familia de consultas también pertenece la obtención de un valor que se calcula a partir de toda la
colección, por ejemplo el máximo valor de una clave o la media de todos los valores.

Estructura
La agregación en MongoDB sigue una estructura tipo "pipeline": diferentes etapas, donde cada una toma la salida de la
anterior.

external image aggregationfwk.jpg

Los elementos de la "tubería" se incluyen en un array y se ejecutarán por orden. Cada elemento puede repetirse y el
orden puede variar.

$project: Su función es "recolocar" el documento. Selecciona las claves que se usarán, y puede "elevar" claves
que están en subdocumentos al nivel superior. Tras un paso $project habrá tantos documentos como inicialmente;
pero con un formato que puede haber variado. (1:1)
$match: Filtra documentos, dejando solo los que vamos a utilizar. (n:1)
$group: Realiza la agregación (n:1)
$sort: Ordena. 1:1
gpd.sip.ucm.es/rafa/docencia/nosql/Agregando.html 1/20
17/5/2020 MongoDB - Agregando

$skip: Saltarse algunos a elementos n:1

$limit: Número de elementos máximo. n:1
$unwind: "aplana" datos de arrays, produciendo tantos elementos como elementos tenga el array. 1:n
$out: crea una colección nueva a partir de los datos. 1:1
$redact: Seguridad. Impide que algunos usuarios vean algunos documentos. n:1
$geonear: Se utiliza para búsquedas por posición (ver índices geoespaciales). n:1
$sample: permite elegir al azar unos cuantos documentos a modo de muestra. n:1
$lookup: join the varias colecciones

Ejemplo
Vamos a usar los siguientes datos para nuestro ejemplo:

use running
db.sesiones.insert({nombre:"Bertoldo", mes:"Marzo", distKm:6, tiempoMin:42})
db.sesiones.insert({nombre:"Herminia", mes:"Marzo", distKm:10, tiempoMin:60})
db.sesiones.insert({nombre:"Bertoldo", mes:"Marzo", distKm:2, tiempoMin:12})
db.sesiones.insert({nombre:"Herminia", mes:"Marzo", distKm:10, tiempoMin:61})
db.sesiones.insert({nombre:"Bertoldo", mes:"Abril", distKm:5, tiempoMin:33})
db.sesiones.insert({nombre:"Herminia", mes:"Abril", distKm:42, tiempoMin:285})
db.sesiones.insert({nombre:"Aniceto", mes:"Abril", distKm:5, tiempoMin:33})

Supongamos que queremos saber el número de sesiones que ha realizado cada persona:

db.sesiones.aggregate( // aggregate significa que vamos a agrupar

[ // lista de operaciones, a realizar en secuencia
{$group: // en este caso solo una operación, agrupar
{ _id:"$nombre", // agrupamos por nombre
num_sesiones: // nueva clave, num_sesiones
{$sum:1} // cuenta el num.elementos en el grupo
}
}
]
)

Se obtiene el resultado:

{ "_id" : "Aniceto", "num_sesiones" : 1 }

{ "_id" : "Herminia", "num_sesiones" : 3 }
{ "_id" : "Bertoldo", "num_sesiones" : 3 }

external image question.pngPregunta. Consideramos el código:

db.coord.drop()
for (var i=0; i<5; i++) { for(j=0; j<4; j++){db.coord.insert({x:i,y:j+i});} }

¿Cuántos elementos mostrará en pantalla la siguiente consulta de agregación?

> db.coord.aggregate([ {$group:{_id:'$x'}} ])

gpd.sip.ucm.es/rafa/docencia/nosql/Agregando.html 2/20
17/5/2020 MongoDB - Agregando

También podemos agrupar por nombre y mes:

db.sesiones.aggregate(
[
{$group:
{ _id:{nombre:"$nombre",
mes: "$mes"},
num_sesiones: {$sum:1}
}
}
]
)

external image question.pngPregunta. Consideramos el código:

db.coord.drop()
for (var i=0; i<5; i++) { for(j=0; j<4; j++){db.coord.insert({x:i,y:j+i});} }

¿Cuántos elementos mostrará en pantalla la siguiente consulta de agregación?

db.coord.aggregate([ {$group:{_id:{lax:'$x', la:'$y'}}} ])

Funciones de agregación
Ya hemos visto una función de agregación, $sum, pero hay muchas otras:

$sum: suma (o incrementa)

$avg : calcula la media
$min: mínimo de los valores
$max: máximo
$push: Mete en un array un valor determinado
$addToSet: Mete en un array los valore que digamos, pero solo una vez
$first: obtiene el primer elemento del grupo, a menudo junto con sort
$last: obtiene el último elemento, a menudo junto con sort

Vamos a verlas una a una:

$sum

Ya la hemos visto como función para "contar" usando $sum:1, pero su propósito original es sumar:

db.sesiones.aggregate(
[
gpd.sip.ucm.es/rafa/docencia/nosql/Agregando.html 3/20
17/5/2020 MongoDB - Agregando
{$group:
{ _id:{nombre:"$nombre"},
num_km: {$sum:'$distKm'}
}
}
]
)

{ "_id" : { "nombre" : "Aniceto" }, "num_km" : 5 }

{ "_id" : { "nombre" : "Herminia" }, "num_km" : 62 }
{ "_id" : { "nombre" : "Bertoldo" }, "num_km" : 13 }

Tenemos el total de kilómetros que ha corrido cada persona.

$avg

Calcula la media. Por ejemplo: kilómetros que corre cada uno de media al mes

db.sesiones.aggregate(
[
{$group:
{ _id:{nombre:"$nombre",
mes: "$mes"},
media: {$avg:'$distKm'}
}
}
]
)

Resultado:

{ "_id" : { "nombre" : "Aniceto", "mes" : "Abril" }, "media" : 5 }

{ "_id" : { "nombre" : "Herminia", "mes" : "Abril" }, "media" : 42 }
{ "_id" : { "nombre" : "Herminia", "mes" : "Marzo" }, "media" : 10 }
{ "_id" : { "nombre" : "Bertoldo", "mes" : "Abril" }, "media" : 5 }
{ "_id" : { "nombre" : "Bertoldo", "mes" : "Marzo" }, "media" : 4 }

external image question.pngPregunta difícil. ¿Cómo calcular el número medio de sesiones por persona al
mes? (es decir, se cuenta el número de sesiones por persona y mes y a continuación se hace la media de este dato)

$addToSet

$addToSet crea arrays agrupando elementos.

Ejemplo: Supongamos que queremos saber qué distancias ha corrido cada persona.
Agrupamos por el nombre y "coleccionamos" las distancias distintas

gpd.sip.ucm.es/rafa/docencia/nosql/Agregando.html 4/20
17/5/2020 MongoDB - Agregando
db.sesiones.aggregate(
[
{$group:
{ _id:{nombre:"$nombre"},
distancias: {$addToSet:'$distKm'}
}
}
]
)

El resultado:

{ "_id" : { "nombre" : "Aniceto" }, "distancias" : [ 5 ] }

{ "_id" : { "nombre" : "Herminia" }, "distancias" : [ 42, 10 ] }
{ "_id" : { "nombre" : "Bertoldo" }, "distancias" : [ 5, 2, 6 ] }

$push

Análogo a $addToSet pero admite repeticiones.

Ejemplo, queremos saber en cada mes qué distancias se han hecho en alguna sesión. Si una distancia se ha corrido
varias veces en ese mes debe aparecer varias veces:

db.sesiones.aggregate(
[
{$group:
{ _id:{mes:"$mes"},
distancias:{$push:'$distKm'}
}
}
]
)

El resultado:

{ "_id" : { "mes" : "Abril" }, "distancias" : [ 5, 42, 5 ] }

{ "_id" : { "mes" : "Marzo" }, "distancias" : [ 6, 10, 2, 10 ] }

$unwind

Es el reverso de $push; cuando tenemos documentos que contienen un array y queremos agrupar por valores del array,
a veces conviene eliminar los
arrays y convertirlos en múltiples documentos.

external image relation.jpeg

En realidad estamos "normalizando" (primera forma normal).

Ejemplo:

Volvemos al ejemplo de personas con aficiones:

db.gustos.insert({nombre:"Bertoldo", aficiones:["siesta","cine"]})
db.gustos.insert({nombre:"Herminia", aficiones:["correr","cine"]})

gpd.sip.ucm.es/rafa/docencia/nosql/Agregando.html 5/20
17/5/2020 MongoDB - Agregando
db.gustos.insert({nombre:"Aniceta", aficiones:["viajar","cine"]})
db.gustos.insert({nombre:"Godofredo", aficiones:["correr","montaña", "cine"]})

Queremos saber el número de personas con el que cuenta cada afición. ¿Cómo hacerlo?

Para ello el primer paso es hacer $unwind:

db.gustos.aggregate([ {$unwind:'$aficiones'} ] )

que da como resultado:

{ "_id" : ObjectId("56b513cc5df4eba0d451ffaa"), "nombre" : "Bertoldo", "aficiones" : "siesta" }
{ "_id" : ObjectId("56b513cc5df4eba0d451ffaa"), "nombre" : "Bertoldo", "aficiones" : "cine" }
{ "_id" : ObjectId("56b513cc5df4eba0d451ffab"), "nombre" : "Herminia", "aficiones" : "correr" }
{ "_id" : ObjectId("56b513cc5df4eba0d451ffab"), "nombre" : "Herminia", "aficiones" : "cine" }
{ "_id" : ObjectId("56b513cc5df4eba0d451ffac"), "nombre" : "Aniceta", "aficiones" : "viajar" }
{ "_id" : ObjectId("56b513cc5df4eba0d451ffac"), "nombre" : "Aniceta", "aficiones" : "cine" }
{ "_id" : ObjectId("56b513cd5df4eba0d451ffad"), "nombre" : "Godofredo", "aficiones" : "correr" }
{ "_id" : ObjectId("56b513cd5df4eba0d451ffad"), "nombre" : "Godofredo", "aficiones" : "montaña" }
{ "_id" : ObjectId("56b513cd5df4eba0d451ffad"), "nombre" : "Godofredo", "aficiones" : "cine" }

Ahora es fácil pensar en la siguiente etapa: agrupar por aficiones

db.gustos.aggregate([
{$unwind:'$aficiones'},
{$group:
{_id:'$aficiones',
total:{$sum:1} } }
] )

Muestra:

{ "_id" : "montaña", "total" : 1 }

{ "_id" : "viajar", "total" : 1 }
{ "_id" : "correr", "total" : 2 }
{ "_id" : "cine", "total" : 4 }
{ "_id" : "siesta", "total" : 1 }

$max, $min

El mayor, menor valor en el grupo.

Ejemplo:
db.sesiones.aggregate(
[
{$group:
{ _id:{nombre:"$nombre"},
maxdist:{$max:'$distKm'},
mindist:{$min:'$distKm'}
}
}
]
)

gpd.sip.ucm.es/rafa/docencia/nosql/Agregando.html 6/20
17/5/2020 MongoDB - Agregando

Resultado:

{ "_id" : { "nombre" : "Aniceto" }, "maxdist" : 5, "mindist" : 5 }

{ "_id" : { "nombre" : "Herminia" }, "maxdist" : 42, "mindist" : 10 }
{ "_id" : { "nombre" : "Bertoldo" }, "maxdist" : 6, "mindist" : 2 }

$first, $last

Devuelven el primero, respectivamente el último elemento de un grupo.

external image question.pngPregunta. Supongamos la colección:

> > db.fun.find()
> { "_id" : 0, "a" : 0, "b" : 0, "c" : 21 }
> { "_id" : 1, "a" : 0, "b" : 0, "c" : 54 }
> { "_id" : 2, "a" : 0, "b" : 1, "c" : 52 }
> { "_id" : 3, "a" : 0, "b" : 1, "c" : 17 }
> { "_id" : 4, "a" : 1, "b" : 0, "c" : 22 }
> { "_id" : 5, "a" : 1, "b" : 0, "c" : 5 }
> { "_id" : 6, "a" : 1, "b" : 1, "c" : 87 }
> { "_id" : 7, "a" : 1, "b" : 1, "c" : 97 }

¿Cuál será el resultado de c tras la siguiente consulta?

db.fun.aggregate([
{$match:{a:0}},
{$sort:{c:-1}},
{$group:{_id:"$a", c:{$first:"$c"}}}
])

Check: número x el número del revés

$bucket y $bucketAuto
El propósito de estas etapas es agrupar según intervalos de una clave. La estructura de $bucket:
{
$bucket: {
groupBy: expression,
boundaries: [ lowerbound1, lowerbound2, ... ],
default: literal,
output: {
output1: { <$accumulator expression> },
...
outputN: { <$accumulator expression> }
}
}
}

gpd.sip.ucm.es/rafa/docencia/nosql/Agregando.html 7/20
17/5/2020 MongoDB - Agregando

Significado:

La parte groupBy corresponde al _id the $group, es decir especifica la clave por la que queremos agrupar. Debe
ser un valor que admita comparaciones ($leq,...)
boundaries es un array que indica los límites por los que agrupar. Por ejemplo [0,20,40] crea dos intervalos:
[0,20), [20,40)
default: Nombre del grupo en el que se incluirán los valores que no encajen. Opcional.
output: claves a incluir en la salida, si no se incluye ninguna al menos se incluirá por defecto count:{$sum:1}

Ejemplo:
Queremos saber cuántas sesiones hay de distancias cortas (0 a 5 km), medias, (5 a 10), largas (10 a 40) o muy largas
(más de 40).
db.sesiones.aggregate( [
{
$bucket: {
groupBy: "$distKm",
boundaries: [ 0, 5, 10, 40 ],
default: "Gran distancia"
}
}
] )

Salida:
mongodb

{ "_id" : 0, "count" : 1 }
{ "_id" : 5, "count" : 3 }
{ "_id" : 10, "count" : 2 }
{ "_id" : "Gran distancia", "count" : 1 }

Supongamos ahora que queremos además saber quiénes han recorrido estas distancias:
db.sesiones.aggregate( [
{
$bucket: {
groupBy: "$distKm",
boundaries: [ 0, 5, 10, 40 ],
default: "Gran distancia",
output: {
"count": { $sum: 1 },
"quienes" : { $addToSet: "$nombre" }
}
}
}
] )

Salida:
mongodb

{ "_id" : 0, "count" : 1, "quienes" : [ "Bertoldo" ] }

{ "_id" : 5, "count" : 3, "quienes" : [ "Aniceto", "Bertoldo" ] }
{ "_id" : 10, "count" : 2, "quienes" : [ "Herminia" ] }
{ "_id" : "Gran distancia", "count" : 1, "quienes" : [ "Herminia" ] }

$bucketAuto tiene el mismo significado, pero en este caso no decimos los intervalos; solo cuántos queremos obtener.
Sintaxis:
{
$bucketAuto: {
groupBy: expression,
buckets: number,

gpd.sip.ucm.es/rafa/docencia/nosql/Agregando.html 8/20
17/5/2020 MongoDB - Agregando
output: {
output1: { <$accumulator expression> },
...
}
granularity: string
}
}

La clave buckets indica el número de intervalos que usará. El sistema intenta repartirlas de forma más o menos
homogénea. Ejemplo:
db.sesiones.aggregate( [
{
$bucketAuto: {
groupBy: "$tiempoMin",
buckets: 4
}
}
] )

Salida:
mongodb

{ "_id" : { "min" : 12, "max" : 42 }, "count" : 3 }

{ "_id" : { "min" : 42, "max" : 61 }, "count" : 2 }
{ "_id" : { "min" : 61, "max" : 285 }, "count" : 2 }

El reparto intenta ser homogéneo, pero lo mejor es definir la granularidad de forma específica (consultar la
documentación).

$facet
$facet es complejo y potente, permite agrupar varios pipeline de agregación. Por ejemplo, supongamos que queremos
agrupar las sesiones de entrenamiento por intervalos de tiempo y aparte por intervalos de kilómetros. Una solución
podría usar dos aggregate, cada una con su correspondiente $bucket. Sin embargo, podemos hacerlo todo a la vez:
db.sesiones.aggregate([
{$facet:
{
"distancia": [
{ $bucket: {
groupBy: "$distKm",
boundaries: [ 0, 5, 10, 40 ],
default: "Gran distancia",
output: {
"count": { $sum: 1 },
"quienes" : { $addToSet: "$nombre" }
}
}
}],
"tiempo": [
{ $bucket: {
groupBy: "$tiempoMin",
boundaries: [ 0, 30, 60 ],
default: "Más de una hora",
output: {
"count": { $sum: 1 },
"quienes" : { $addToSet: "$nombre" }
}
}

gpd.sip.ucm.es/rafa/docencia/nosql/Agregando.html 9/20
17/5/2020 MongoDB - Agregando
}]

}
}
])

Resultado:
{
"distancia" : [
{
"_id" : 0,
"count" : 1,
"quienes" : [
"Bertoldo"
]
},
{
"_id" : 5,
"count" : 3,
"quienes" : [
"Aniceto",
"Bertoldo"
]
},
{
"_id" : 10,
"count" : 2,
"quienes" : [
"Herminia"
]
},
{
"_id" : "Gran distancia",
"count" : 1,
"quienes" : [
"Herminia"
]
}
],
"tiempo" : [
{
"_id" : 0,
"count" : 1,
"quienes" : [
"Bertoldo"
]
},
{
"_id" : 30,
"count" : 3,
"quienes" : [
"Aniceto",
"Bertoldo"
]
},
{
"_id" : "Más de una hora",
"count" : 3,
"quienes" : [
"Herminia"
]
}
]
}

gpd.sip.ucm.es/rafa/docencia/nosql/Agregando.html 10/20
17/5/2020 MongoDB - Agregando

$project
Project está al nivel de $group o de $bucket, es decir es una de las etapas permitidas en aggregate. Resulta muy útil
para cambiar nombres de claves, introducir nuevas claves, etc. Es decir, su objetivo es "preparar" la agregación. En
ocasiones se utiliza para crear nuevas colecciones.
Se suele usar con los siguientes operadores:

booleanos: $and, $or, $not

strings: $concat, $toUpper, $toLower, $substr, $strcasecmp
operadores aritméticos: $abs, $add, $ceil, $divide, $exp, $floor, $ln, $log, $log10, $mod, $multiply, $pow, $sqrt,
$substract, $trunc
conjuntos (arrays vistos como): $setEquals, $setInsersection, $setUnion, $setDifference, $setIsSubset,
$anyElementTrue, $allElementsTrue
arrays: $arrayElementAt, $concatArrays, $filter, $isArray, $size, $slice
fechas: $datOfYear, $dayOfMonth, $dayOfWeek, $yrear, $month, $week, $hour, $minute, $second,
$millisecond, $dateToString
condicionales: cond, ifnull
otros: map, let

Ejemplo:

Queremos disponer de los datos de distancias recorridas en millas, sabiendo que

una milla = 1,60934 km

db.sesiones.aggregate(
[
{$project:
{
distMillas:{'$multiply':['$distKm',1.60934]}
}
}
]
)

Observación $project solo incluye las claves que se indiquen, con excepción del _id que se incluye siempre pero se
puede eliminar explícitamente el id con _id:0 . Si se quiere que una clave aparezca tal cual se puede poner clave:1 en la
proyección

Aviso: A partir de la observación anterior, si ponemos clave:1 incluirá el valor original, pero ¿y si queremos que
tenga el valor 1? En este caso y similares es útil $literal; se pondría clave:{'$literal':1}

gpd.sip.ucm.es/rafa/docencia/nosql/Agregando.html 11/20
17/5/2020 MongoDB - Agregando

external image question.pngPregunta. Considera el ejemplo. Queremos que documentos como:

> nombre:"Bertoldo", mes:"Marzo", distKm:6, tiempoMin:42}
> [[code]]
se transformen en documentos de la forma:
> [[code format="javascript"]]
{name:"BERTOLDO", distKm:6}

$match
Filtra elementos. Se puede usar tanto antes de la agregación (sería el where de SQL) como después (sería el having).

Ejemplo:

Queremos obtener la media en kilómetros mensuales de cada corredor, pero solo para aquellos valores medios sobre
5km,

db.sesiones.aggregate( [
{$group: { _id:{nombre:"$nombre", mes: "$mes"}, media: $avg:'$distKm'} } },
{$match: {media:{$gt:5}} } ]
)

Resultado:

{ "_id" : { "nombre" : "Herminia", "mes" : "Abril" }, "media" : 42 }

{ "_id" : { "nombre" : "Herminia", "mes" : "Marzo" }, "media" : 10 }

Observación Dentro de $match se puede usar por ejemplo $text con $search para buscar textos (se utiliza con
índices textuales)

$sort
Sort se emplea para ordenar los resultados. Hay dos formas de ordenar:

En memoria: es el método por defecto. Es el más rápido pero tiene como límite 100 Mb en la colección a ordenar
Disco: más lento, pero sin límites; se obtiene añadiendo una etapa con forma {allowDiskUse:true}

Observación $match y $sort pueden usar índices, pero solo si se hacen al principio del pipeline

gpd.sip.ucm.es/rafa/docencia/nosql/Agregando.html 12/20
17/5/2020 MongoDB - Agregando

Ejemplo: en el ejemplo de media de kilómetros por corredor y mes, ordenar por mes.

db.sesiones.aggregate(
[
{$group:
{ _id:{nombre:"$nombre",
mes: "$mes"},
media: {$avg:'$distKm'}
}
},
{$sort: {'_id.mes':1} }
]
)

Respuesta del sistema:

{ "_id" : { "nombre" : "Aniceto", "mes" : "Abril" }, "media" : 5 }

{ "_id" : { "nombre" : "Herminia", "mes" : "Abril" }, "media" : 42 }
{ "_id" : { "nombre" : "Bertoldo", "mes" : "Abril" }, "media" : 5 }
{ "_id" : { "nombre" : "Herminia", "mes" : "Marzo" }, "media" : 10 }
{ "_id" : { "nombre" : "Bertoldo", "mes" : "Marzo" }, "media" : 4 }

$skip, $limit
Son análogos al caso de find, y se usan siempre en combinación con sort. Útiles para obtener el mayor , el primero, etc

Ejemplo: corredor que tiene mayor media absoluta:

db.sesiones.aggregate(
[
{$group:
{ _id:{nombre:"$nombre"},
media: {$avg:'$distKm'}
}
},
{$sort: {media:-1} },
{$limit:1}
]
)

Y se obtiene:

"_id" : { "nombre" : "Herminia" }, "media" : 20.666666666666668 }

Observación Siempre primero $skip y luego $limit

gpd.sip.ucm.es/rafa/docencia/nosql/Agregando.html 13/20
17/5/2020 MongoDB - Agregando

external image pipeline.jpg

Etapas
Una de las características más interesantes de las agrupaciones
en MongoDB es que no solo se pueden combinar etapas, sino
que incluso se pueden repetir. Ha llegado el momento de usar un
poco la imaginación y unir los componentes que hemos visto
hasta ahora. La idea recuerda un poco a las "vistas" en SQL

Vamos a retomar alguna de las preguntas que hemos dejado sin contestar.

external image question.pngPregunta difícil. ¿Cómo calcular el número medio de sesiones por persona al mes? (es
decir, se cuenta el número de sesiones por persona y mes y a continuación se hace la media de este dato)

Idea:
- Sabemos contar el número de sesiones por mes.
- Sabemos hacer la media de unos valores

¡usemos 2 etapas!

db.sesiones.aggregate(
[
{$group:
{ _id:{nombre:"$nombre", mes: "$mes"},
sesiones:{$sum:1}
}
} ,

{$group:
{_id:'$_id.nombre',
media:{$avg:'$sesiones'}
}
}
]
)

Es interesante observar que en la segunda agregación agrupamos por _id.nombre, ya que el _id de la etapa anterior es
un documento con dos subcomponentes _id y media.

external image question.pngPregunta. Consideramos la colección "fun":

db.fun.find()
{ "_id" : 0, "a" : 0, "b" : 0, "c" : 21 }
{ "_id" : 1, "a" : 0, "b" : 0, "c" : 54 }
{ "_id" : 2, "a" : 0, "b" : 1, "c" : 52 }
{ "_id" : 3, "a" : 0, "b" : 1, "c" : 17 }
{ "_id" : 4, "a" : 1, "b" : 0, "c" : 22 }
{ "_id" : 5, "a" : 1, "b" : 0, "c" : 5 }
{ "_id" : 6, "a" : 1, "b" : 1, "c" : 87 }
{ "_id" : 7, "a" : 1, "b" : 1, "c" : 97 }
gpd.sip.ucm.es/rafa/docencia/nosql/Agregando.html 14/20
17/5/2020 MongoDB - Agregando

¿Qué devolverá la consulta de agregación?

db.fun.aggregate([
{$group:{_id:{a:"$a", b:"$b"}, c:{$max:"$c"}}},
{$group:{_id:"$_id.a", c:{$min:"$c"}}}
])

Check: 4 números que suman 75

$out
Redirige la salida de una agrupación creando una nueva colección. Es muy fácil de utilizar:

db.sesiones.aggregate(
[
{$group:
{ _id:{nombre:"$nombre", mes: "$mes"},
sesiones:{$sum:1}
}
} ,

{$group:
{_id:'$_id.nombre',
media:{$avg:'$sesiones'}
}
},

{$out: 'sesiones_persona_mes'}
]
)

No muestra nada en la salida, porque se ha redireccionado a la nueva colección sesiones_persona_mes. Podemos

comprobarlo:

db.sesiones_persona_mes.find()
{ "_id" : "Bertoldo", "media" : 3 }
{ "_id" : "Herminia", "media" : 3 }
{ "_id" : "Aniceto", "media" : 2 }

Aviso: $out es destructivo: si la colección ya existe la borra

$lookup
gpd.sip.ucm.es/rafa/docencia/nosql/Agregando.html 15/20
17/5/2020 MongoDB - Agregando

Es una etapa añadida en Mongo 3.2

Sintaxis:

{
$lookup:
{
from: <collection to join>,
localField: <field from the input documents>,
foreignField: <field from the documents of the "from" collection>,
as: <output array field>
}
}

Ejemplo: utilizando las colecciones "sesiones" y "gustos" definidas en este capítulo, queremos conocer, para la persona
que mayor distancia total ha recorrido:

Su nombre
La distancia total recorrida
Sus aficiones

Solución:

db.sesiones.aggregate(
[
{$group:
{ _id:{nombre:"$nombre"},
total:{$sum:'$distKm'}
}
},

{$sort:{total:-1}},

{$limit:1},

{$lookup:{
from:'gustos',
localField:'_id.nombre',
foreignField: 'nombre',
as: 'susGustos' }
},

{$unwind:'$susGustos'},

{$project: {
_id:0,
nombre:'$_id.nombre',
total:1,
aficiones: '$susGustos.aficiones' }
}

]
)

La respuesta:

{ "total" : 124, "nombre" : "Herminia", "aficiones" : [ "correr", "cine" ] }

gpd.sip.ucm.es/rafa/docencia/nosql/Agregando.html 16/20
17/5/2020 MongoDB - Agregando

external image question.pngPregunta. ¿Se podría quitar el sort y el limit, y a cambio añadir un group con max?
Algo parecido a:
db.sesiones.aggregate(
[
{$group:
{ _id:{nombre:"$nombre"},
total:{$sum:'$distKm'}
}
},

{$group:
{
_id:null,
mayor:{'$max':'$total'}
}
} ])

Observación El uso de _id:null es el truco que permite agrupar toda la colección.

Observación Se puede obtener el plan de una operación de agrupación añadiendo una etapa final {explain:true}

Map Reduce

Es un sistema de procesamiento basado en dos etapas:

map. Entrada: un documento. Salida: para cada documento se genera una o varias parejas (clave,valor)
reduce. Entrada: una clave con todos sus valores. Salida: un valor (asociado de forma implícita a la clave de
entrada)

gpd.sip.ucm.es/rafa/docencia/nosql/Agregando.html 17/20
17/5/2020 MongoDB - Agregando

external image MapReduce.jpg

(fuente: http://dme.rwth-aachen.de/en/system/files/file_upload/project/MapReduce.jpg)

Esquema general en MongoDB:

external image map-reduce.png

(fuente: https://docs.mongodb.org/manual/_images/map-reduce.png )

Ejemplo 1:

Partimos de la siguiente colección:

db.frases.drop()
db.frases.insert({_id:1,frase:"el que sabe no habla"})
db.frases.insert({_id:2,frase:"el que habla no sabe"})
db.frases.insert({_id:3,frase:"no me digas que no"})

Queremos contar el número de repeticiones de cada palabra.

var mapFunctionFrase = function(){

x = this.frase.split(" ");
for (var i=0; i<x.length; i++)
emit(x[i], 1);
};

gpd.sip.ucm.es/rafa/docencia/nosql/Agregando.html 18/20
17/5/2020 MongoDB - Agregando
var reduceFunctionFrase = function(palabra,cuantas){
return Array.sum(cuantas);};

db.frases.mapReduce(mapFunctionFrase,
reduceFunctionFrase,
{out: "palabras"}
)

Ejemplo 2:

En el ejemplo anterior, obtener la longitud de la frase más larga en toda la colección:

var mapFunctionFraseLarga = function(){

emit("max", this.frase.length);
};
var reduceFunctionFraseLarga = function(clave,longs){
max = longs[0];
for (var i=1; i<longs.length;i++)
if (longs[i]>max)
max = longs[i];

return max;};

db.frases.mapReduce(mapFunctionFraseLarga,
reduceFunctionFraseLarga,
{out: {inline:1}}
)

Ejemplo 3:

Volvemos a considerar el ejemplo de las sesiones de entrenamiento, queremos saber cuántos kilómetros a recorrido
cada persona al mes usando MapReduce:

var mapKmPersonaMes = function(){

emit({nombre:this.nombre, mes:this.mes}, this.distKm);
};
var reduceKmPersonaMes = function(dato,cuantos){
return Array.sum(cuantos);
};

db.sesiones.mapReduce(mapKmPersonaMes,
reduceKmPersonaMes,
{out: "kmMes"}
)

Vistas
Las vistas se introdujeron en la versión 3.4 de MongoDB. Se puede pensar en una vista como una colección "virtual"
que se crea a partir de una consulta.

Características principales:

1. Las vistas se definen a través de una consulta de agregación.

gpd.sip.ucm.es/rafa/docencia/nosql/Agregando.html 19/20
17/5/2020 MongoDB - Agregando
db.createView(view, source, pipeline, collation)

Donde
1. view: Un string con el nombre de la vista a crear.
2. source: Un string con el nombre de la colección en la que se basa.
3. pipeline: la secuencia de agregación que define la vista
4. collation: adaptaciones locales ver aquí
2. Las vistas son de solo lectura; es decir no podemos insertar/borrar/actualizar datos en una vista. En particular las
vistas solo se pueden usar en las instrucciones:
db.collection.find()
db.collection.findOne()
db.collection.aggregate()
db.collection.count()
db.collection.distinct()
3. Si actualizamos la colección base la vista automáticamente cambia.
4. Se muestran como una colleción más con "show collections".
5. La consulta se almacena en System.views.

Enlaces

Un buen editor online de código javascript, para teclear las consultas: https://jsfiddle.net/
Manual de Mongo DB: agregación
Charla sobre agregación en MongoDB

Página principal MongoDB

gpd.sip.ucm.es/rafa/docencia/nosql/Agregando.html 20/20

También podría gustarte

de Postgresql
Aún no hay calificaciones
de Postgresql
15 páginas
EV03 Taller Bases de Datos NoSQL
Aún no hay calificaciones
EV03 Taller Bases de Datos NoSQL
5 páginas
Taller Mongo DB
Aún no hay calificaciones
Taller Mongo DB
25 páginas
Tema 3 - Mongodb - Crud - I
Aún no hay calificaciones
Tema 3 - Mongodb - Crud - I
39 páginas
Guía Paso A Paso Mongodb
Aún no hay calificaciones
Guía Paso A Paso Mongodb
15 páginas
Mongo DB
Aún no hay calificaciones
Mongo DB
68 páginas
Qué Es Un Framework
Aún no hay calificaciones
Qué Es Un Framework
14 páginas
C4A Libro3
Aún no hay calificaciones
C4A Libro3
46 páginas
Taller JSP
Aún no hay calificaciones
Taller JSP
8 páginas
Clase 29. Python 5
Aún no hay calificaciones
Clase 29. Python 5
28 páginas
Desarrollo de Aplicaciones Web III
Aún no hay calificaciones
Desarrollo de Aplicaciones Web III
11 páginas
Taller
Aún no hay calificaciones
Taller
11 páginas
Topicos Avanzados SQL
100% (1)
Topicos Avanzados SQL
25 páginas
Clase 18 - CRUD en MongoDB
Aún no hay calificaciones
Clase 18 - CRUD en MongoDB
59 páginas
TemaI-C04 Clases, Objetos y Métodos en Java
Aún no hay calificaciones
TemaI-C04 Clases, Objetos y Métodos en Java
45 páginas
MapeoObjetosRelacional PDF
Aún no hay calificaciones
MapeoObjetosRelacional PDF
17 páginas
Pymongo
Aún no hay calificaciones
Pymongo
27 páginas
Desarrollo Web y Sus Componentes
Aún no hay calificaciones
Desarrollo Web y Sus Componentes
15 páginas
Fundamentos de La Programación Orientada A Objetos en Java
Aún no hay calificaciones
Fundamentos de La Programación Orientada A Objetos en Java
17 páginas
Programacion Web JSP, Servlet y Operaciones
Aún no hay calificaciones
Programacion Web JSP, Servlet y Operaciones
7 páginas
Mongo DB y Mongo DB Atlas
Aún no hay calificaciones
Mongo DB y Mongo DB Atlas
23 páginas
CRUDnLaravel 686553aef774a14
Aún no hay calificaciones
CRUDnLaravel 686553aef774a14
17 páginas
Práctica #11: Node JS y Express: Desarrollo de Aplicaciones
Aún no hay calificaciones
Práctica #11: Node JS y Express: Desarrollo de Aplicaciones
42 páginas
LENGUAJE DE PROGRAMACION-Semana 2
Aún no hay calificaciones
LENGUAJE DE PROGRAMACION-Semana 2
31 páginas
Laboratorio 03 Instalación y Gestión de Una Base de Datos Mongo DB
Aún no hay calificaciones
Laboratorio 03 Instalación y Gestión de Una Base de Datos Mongo DB
10 páginas
Crear Un Web Service API Rest Con PHP y MySQL
Aún no hay calificaciones
Crear Un Web Service API Rest Con PHP y MySQL
20 páginas
Algebra Relacional PDF
100% (2)
Algebra Relacional PDF
6 páginas
Operaciones CRUD en Mongodb
Aún no hay calificaciones
Operaciones CRUD en Mongodb
6 páginas
Clase 14 - Python 2 - Tipos de Datos, Entrada y Salida de Informacion
Aún no hay calificaciones
Clase 14 - Python 2 - Tipos de Datos, Entrada y Salida de Informacion
52 páginas
MongoDB - Macario Polo
0% (1)
MongoDB - Macario Polo
154 páginas
Sesion 1 - Introducción A Powerpivot para Excel
Aún no hay calificaciones
Sesion 1 - Introducción A Powerpivot para Excel
23 páginas
Glab - S09 - Dapaza - 2022-02 (Web)
Aún no hay calificaciones
Glab - S09 - Dapaza - 2022-02 (Web)
25 páginas
S04.s1 - Fundamentos JSP
Aún no hay calificaciones
S04.s1 - Fundamentos JSP
33 páginas
Guia Mongo DB
100% (1)
Guia Mongo DB
14 páginas
Guia9-Desarrollo Web JSP (MVC)
Aún no hay calificaciones
Guia9-Desarrollo Web JSP (MVC)
28 páginas
GUÍA 7 - Paso A Paso Login Básico PHP
Aún no hay calificaciones
GUÍA 7 - Paso A Paso Login Básico PHP
14 páginas
Crear Struts2 Hibernate en Eclipse
Aún no hay calificaciones
Crear Struts2 Hibernate en Eclipse
16 páginas
Diagrama de Clases y Sus Relaciones
Aún no hay calificaciones
Diagrama de Clases y Sus Relaciones
40 páginas
Consultas en MongoDB
Aún no hay calificaciones
Consultas en MongoDB
14 páginas
Js 6 Ejercicios 1
100% (1)
Js 6 Ejercicios 1
78 páginas
Metodologías de Programación
Aún no hay calificaciones
Metodologías de Programación
20 páginas
Guia Laboratorio #02
100% (1)
Guia Laboratorio #02
4 páginas
Unidad III Presentacion Java
Aún no hay calificaciones
Unidad III Presentacion Java
11 páginas
(DIM BDNoSQL 2019 2020) 3.BD - Documentales - MongoDB
Aún no hay calificaciones
(DIM BDNoSQL 2019 2020) 3.BD - Documentales - MongoDB
139 páginas
Presentación 6 - Condicionales Anidados - Ciclos
Aún no hay calificaciones
Presentación 6 - Condicionales Anidados - Ciclos
14 páginas
Practica de SQL Server 3 Restricciones
Aún no hay calificaciones
Practica de SQL Server 3 Restricciones
4 páginas
Conocimientos Basicos Del Servidor PostgreSQL
Aún no hay calificaciones
Conocimientos Basicos Del Servidor PostgreSQL
16 páginas
Presentación MongoDB
Aún no hay calificaciones
Presentación MongoDB
12 páginas
Manual Mongo Basico
Aún no hay calificaciones
Manual Mongo Basico
20 páginas
XML Ejemplos
Aún no hay calificaciones
XML Ejemplos
16 páginas
Pool de Conexiones A BD Por NetBeans
Aún no hay calificaciones
Pool de Conexiones A BD Por NetBeans
10 páginas
Python
Aún no hay calificaciones
Python
29 páginas
Lenguaje SQL
Aún no hay calificaciones
Lenguaje SQL
118 páginas
S01.s1 - Lenguaje Java
Aún no hay calificaciones
S01.s1 - Lenguaje Java
25 páginas
Ejercicios. XQuery
Aún no hay calificaciones
Ejercicios. XQuery
5 páginas
Consultas de Mongo 2 Cases
Aún no hay calificaciones
Consultas de Mongo 2 Cases
3 páginas
Apuntes Mongo DB
Aún no hay calificaciones
Apuntes Mongo DB
75 páginas
Ejemongodb
Aún no hay calificaciones
Ejemongodb
5 páginas
Guia Base de Datos Alumno
Aún no hay calificaciones
Guia Base de Datos Alumno
12 páginas
3 consultasMongoDB
Aún no hay calificaciones
3 consultasMongoDB
37 páginas
Valores Porcentaje Poblacion
Aún no hay calificaciones
Valores Porcentaje Poblacion
1 página
Seat Ibiza Web
Aún no hay calificaciones
Seat Ibiza Web
2 páginas
Separacion en La Fuente Asocampo
Aún no hay calificaciones
Separacion en La Fuente Asocampo
3 páginas
EPStab
Aún no hay calificaciones
EPStab
1 página
TabMun SantaRosa
Aún no hay calificaciones
TabMun SantaRosa
1 página
Decreto Modificacion Pico Cedula 13-27 Abril PDF
Aún no hay calificaciones
Decreto Modificacion Pico Cedula 13-27 Abril PDF
9 páginas
"SHUTDOWN" Comando para Apagar PC Desde CMD
Aún no hay calificaciones
"SHUTDOWN" Comando para Apagar PC Desde CMD
11 páginas
MongoDB - Agregando
100% (1)
MongoDB - Agregando
20 páginas
MongoDB - Agregando
100% (1)
MongoDB - Agregando
20 páginas
El Comando Shutdown - Neoguias
Aún no hay calificaciones
El Comando Shutdown - Neoguias
10 páginas
RedPrestadores Nororiente CuartoNivel
Aún no hay calificaciones
RedPrestadores Nororiente CuartoNivel
3 páginas
Software Fisica
Aún no hay calificaciones
Software Fisica
16 páginas
Desarrollo Caso Práctico Comercio Internacional - U3
Aún no hay calificaciones
Desarrollo Caso Práctico Comercio Internacional - U3
9 páginas
Tutorial. Afiliación de Entrust Token
Aún no hay calificaciones
Tutorial. Afiliación de Entrust Token
10 páginas
Informe McGregor
Aún no hay calificaciones
Informe McGregor
19 páginas
Gestión de La Calidad
Aún no hay calificaciones
Gestión de La Calidad
29 páginas
Programa Modelizado de Minería de Datos
Aún no hay calificaciones
Programa Modelizado de Minería de Datos
5 páginas
Tesis Maestría
Aún no hay calificaciones
Tesis Maestría
35 páginas
La Informática Es La Rama de La Ingeniería Que
Aún no hay calificaciones
La Informática Es La Rama de La Ingeniería Que
2 páginas
Manual de Usuario v2.0 - ADMWEB
Aún no hay calificaciones
Manual de Usuario v2.0 - ADMWEB
13 páginas
Métodos Abreviados de Teclado
Aún no hay calificaciones
Métodos Abreviados de Teclado
1 página
Inte00006 T2 L2 Ok
Aún no hay calificaciones
Inte00006 T2 L2 Ok
6 páginas
Silabo Taller de Soporte Tecnico en Ti
Aún no hay calificaciones
Silabo Taller de Soporte Tecnico en Ti
9 páginas
Llamada A Procedimiento Remoto
Aún no hay calificaciones
Llamada A Procedimiento Remoto
5 páginas
Resumen - Estudio Del Trabajo
Aún no hay calificaciones
Resumen - Estudio Del Trabajo
11 páginas
Instalación de Cliente Openvpn Windows
Aún no hay calificaciones
Instalación de Cliente Openvpn Windows
4 páginas
CURRICULUM VITA-Norman
Aún no hay calificaciones
CURRICULUM VITA-Norman
9 páginas
Notepadplusplus Es PDF
Aún no hay calificaciones
Notepadplusplus Es PDF
27 páginas
Identificacion de Procesos Organizacionales - Ga1-220501092-Aa1-Ev03
Aún no hay calificaciones
Identificacion de Procesos Organizacionales - Ga1-220501092-Aa1-Ev03
5 páginas
Replicacion de Mezcla SQL Server
Aún no hay calificaciones
Replicacion de Mezcla SQL Server
14 páginas
Diego Ferney Ballen Contrato Corregido
Aún no hay calificaciones
Diego Ferney Ballen Contrato Corregido
10 páginas
Sílabo 2023 02 Servicio Al Cliente (2261) SP
Aún no hay calificaciones
Sílabo 2023 02 Servicio Al Cliente (2261) SP
7 páginas
Ex Posicion
Aún no hay calificaciones
Ex Posicion
7 páginas
Tesys U Lulc15 Advantys STB Módulo de Comunicación: Manual Del Usuario
Aún no hay calificaciones
Tesys U Lulc15 Advantys STB Módulo de Comunicación: Manual Del Usuario
74 páginas
La Interfaz Grafica de Usuario
Aún no hay calificaciones
La Interfaz Grafica de Usuario
1 página
App Inventor
100% (2)
App Inventor
18 páginas
Apuntes de Python
100% (1)
Apuntes de Python
15 páginas
Introducción A Algoritmos y Programas
Aún no hay calificaciones
Introducción A Algoritmos y Programas
9 páginas
Cómo Instalar Oracle Java JDK en Ubuntu Linux - 17 Pasos
Aún no hay calificaciones
Cómo Instalar Oracle Java JDK en Ubuntu Linux - 17 Pasos
8 páginas
CVMariana Dominguez
Aún no hay calificaciones
CVMariana Dominguez
2 páginas
Artículos de Divulgación
Aún no hay calificaciones
Artículos de Divulgación
79 páginas