Transforme seus dados com agregação
Visão geral
Neste guia, você pode aprender como usar o driver Kotlin Sync para executar operações de agregação.
Você pode usar operações de agregação para processar dados em suas coleções MongoDB e retornar resultados calculados. A estrutura de agregação MongoDB , que faz parte da API de query, é modelada sobre o conceito de um pipeline de processamento de dados. Os documentos entram em um pipeline que contém um ou mais estágios, e cada estágio transforma os documentos para gerar um resultado final agregado.
Você pode pensar em uma operação de agregação semelhante a uma fábrica de carros. Uma fábrica de automóveis tem uma linha de montagem, que contém estações de montagem com ferramentas especializadas para realizar trabalhos específicos, como furadeiras e soldadores. As peças brutas entram na fábrica e, em seguida, a linha de montagem transforma e as monta em um produto acabado.
O pipeline de agregação é a linha de montagem, estágios de agregação são as estações de montagem e expressões do operador são as ferramentas especializadas.
Comparar agregação e encontrar operações
Você pode usar encontrar operações para executar as seguintes ações:
Selecione quais documentos devolver
Selecione quais campos retornar
ordenar os resultados
Você pode usar operações de agregação para executar as seguintes ações:
Execute operações de localização
Renomear campos
Calcular campos
Resumir dados
Agrupar valores
Limitações
As seguintes limitações se aplicam ao usar operações de agregação :
Os documentos devolvidos não devem violar o limite de tamanho de documento BSON de 16 megabytes.
Os estágios do pipeline têm um limite de memória de 100 megabytes por padrão. Você pode exceder este limite utilizando o método
allowDiskUse()
da classeAggregateIterable
.
Importante
exceção $graphLookup
O estágio $graphLookup tem um limite de memória rigoroso de 100 megabytes e ignora a opção allowDiskUse
.
Exemplo de agregação
Os exemplos nesta seção utilizam a coleção do restaurants
no banco de dados de dados do sample_restaurants
a partir do conjunto de dados de amostra do Atlas. Para saber como criar um cluster MongoDB Atlas gratuito e carregar os conjuntos de dados de amostra, consulte o guia Iniciar com Atlas .
A seguinte classe de dados Kotlin modela os documentos nesta coleção:
data class Restaurant( val name: String, val cuisine: String, val borough: String )
Criar e Executar um Pipeline de Agregação
Para executar uma agregação nos documentos em uma coleção, passe uma lista de estágios de agregação para o método aggregate()
.
Este exemplo gera uma contagem do número de Padarias em cada bairro da cidade de Nova York. O seguinte código cria um pipeline de agregação que contém os seguintes estágios:
Um estágio $match para filtrar os documentos em que o valor do campo
cuisine
é"Bakery"
.Um estágio $group para agrupar os documentos correspondentes pelo campo
borough
, produzindo uma contagem de documentos para cada valor distinto desse campo.
val pipeline = listOf( Aggregates.match(Filters.eq(Restaurant::cuisine.name, "Bakery")), Aggregates.group("\$borough", Accumulators.sum("count", 1)) ) val results = collection.aggregate<Document>(pipeline) results.forEach { result -> println(result) }
Document{{_id=Bronx, count=71}} Document{{_id=Manhattan, count=221}} Document{{_id=Brooklyn, count=173}} Document{{_id=Queens, count=204}} Document{{_id=Staten Island, count=20}} Document{{_id=Missing, count=2}}
Dica
Ao especificar uma chave de grupo para o estágio de agregação $group
, certifique-se de trocar quaisquer $
caracteres usando o caractere \
.
Explicar uma agregação
Para visualizar informações sobre como o MongoDB executa sua operação, você pode incluir o estágio de agregação $explain
em seu pipeline. Quando o MongoDB explica uma operação, ele retorna planos de execução e estatísticas de desempenho. Um plano de execução é uma maneira em potencial de o MongoDB concluir uma operação. Quando você instrui o MongoDB a explicar uma operação, ele retorna o plano que o MongoDB selecionou para a operação e quaisquer planos de execução rejeitados.
O seguinte exemplo de código executa a mesma agregação mostrada na seção anterior e adiciona o estágio $explain
para produzir os detalhes da operação:
print(collection.aggregate(pipeline).explain())
{ "explainVersion": "2", "queryPlanner": { "namespace": "sample_restaurants.restaurants" "indexFilterSet": false, "parsedQuery": { "cuisine": {"$eq": "Bakery"} }, "queryHash": "865F14C3", "planCacheKey": "0697561B", "optimizedPipeline": true, "maxIndexedOrSolutionsReached": false, "maxIndexedAndSolutionsReached": false, "maxScansToExplodeReached": false, "winningPlan": { ... } ... } ... }
Atlas Search
Você pode executar uma query do Atlas Search criando e executando um pipeline de agregação que contenha um dos seguintes estágios de pipeline:
$search
$searchMeta
Para saber mais sobre os estágios do pipeline do Atlas Search, consulte Escolher o estágio do pipeline de agregação na documentação do Atlas.
Criar um estágio de pesquisa de pipeline
Você pode criar os critérios de pesquisa em seu estágio de pipeline do Atlas Search usando Operadores de pesquisa.
O driver Kotlin Sync fornece métodos assistente para os seguintes operadores:
Operador | Descrição |
---|---|
Executa uma pesquisa por uma palavra ou frase que contém uma sequência de caracteres de uma string de entrada incompleta. | |
Combina dois ou mais operadores em uma única query. | |
Verifica se um campo corresponde a um valor que você especificou. Mapeia para os métodos | |
Testa se existe um caminho para um nome de campo indexado especificado em um documento. | |
Executa uma pesquisa por uma array de valores de número BSON, data, boolean, ObjectId, uuid ou string no caminho fornecido e retorna documentos em que o valor do campo é igual a qualquer valor na array especificada. | |
Retorna documentos semelhantes aos documentos de entrada. | |
Suporta a consulta e pontuação de valores numéricos, de data e de ponto GeoJSON . | |
Executa uma pesquisa de documentos contendo uma sequência ordenada de termos usando o analisador especificado na configuração do índice. | |
Suporta a realização de query de uma combinação de campos e valores indexados. | |
Suporta a consulta e pontuação de valores numéricos, de data e de cadeia de caracteres. Mapeia para os métodos | |
Interpreta o campo de query como uma expressão regular. | |
Executa uma pesquisa de texto completo usando o analisador especificado na configuração do índice. | |
Habilita queries que usam caracteres especiais na string de pesquisa que podem corresponder a qualquer caractere. |
Exemplo de estágio de pesquisa de pipeline
Observação
Conjunto de Dados de Amostra do Atlas
Este exemplo utiliza a collection sample_mflix.movies
a partir do conjunto de dados de amostra do Atlas . Para saber como configurar um Atlas cluster de camada grátis e carregar o conjunto de dados de amostra, consulte o tutorial Introdução ao Atlas na documentação do Atlas.
Antes de executar este exemplo, você deve criar um índice do Atlas Search na coleção movies
que tenha a seguinte definição:
{ "mappings": { "dynamic": true, "fields": { "title": { "analyzer": "lucene.keyword", "type": "string" }, "genres": { "normalizer": "lowercase", "type": "token" } } } }
Para saber mais sobre como criar índices do Atlas Search, consulte o guia dos índices do Atlas Search e Vector Search.
O seguinte código cria um estágio $search
que tem as seguintes especificações:
Verifica se a array
genres
inclui"Comedy"
Pesquisa no campo
fullplot
a frase"new york"
Corresponde a
year
valores entre1950
e2000
, inclusivePesquisa valores
title
que começam com o termo"Love"
val searchStage = Aggregates.search( SearchOperator.compound() .filter( listOf( SearchOperator.`in`(fieldPath("genres"), listOf("Comedy")), SearchOperator.phrase(fieldPath("fullplot"), "new york"), SearchOperator.numberRange(fieldPath("year")).gtLt(1950, 2000), SearchOperator.wildcard(fieldPath("title"), "Love *") ) ) ) val projectStage = Aggregates.project( Projections.include("title", "year", "genres")) val pipeline = listOf(searchStage, projectStage) val results = collection.aggregate(pipeline) results.forEach { result -> println(result) }
Document{{_id=..., genres=[Comedy, Romance], title=Love at First Bite, year=1979}} Document{{_id=..., genres=[Comedy, Drama], title=Love Affair, year=1994}}
Para saber mais sobre os métodos assistente do Atlas Search, consulte a referência da interface SearchOperator na documentação da API Driver Core.
Informações adicionais
Para ver uma lista completa de operadores de expressão , consulte Operadores de aggregation no manual do MongoDB Server .
Para saber mais sobre como montar um pipeline de agregação e ver exemplos, consulte Pipeline de agregação no manual do MongoDB Server .
Para saber mais sobre como criar estágios de pipeline, consulte Estágios de agregação no manual do MongoDB Server .
Para saber mais sobre como explicar as operações do MongoDB , consulte Explicar planos de saída e query no manual do MongoDB Server .
Documentação da API
Para obter mais informações sobre como executar operações de agregação com o driver Kotlin Sync, consulte a seguinte documentação da API: