0% acharam este documento útil (0 voto)
82 visualizações5 páginas

Module 1 Exercise

1. O documento apresenta um caderno de exercícios sobre SQL e bancos de dados relacionais utilizando as ferramentas AWS S3 e AWS Athena. 2. Os alunos devem configurar buckets S3, criar uma tabela no AWS Athena e executar 3 consultas SQL, exportando os resultados para análise. 3. O objetivo é explorar os dados de um banco de clientes utilizando linguagem SQL e serviços de nuvem.

Enviado por

adauri campos
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
82 visualizações5 páginas

Module 1 Exercise

1. O documento apresenta um caderno de exercícios sobre SQL e bancos de dados relacionais utilizando as ferramentas AWS S3 e AWS Athena. 2. Os alunos devem configurar buckets S3, criar uma tabela no AWS Athena e executar 3 consultas SQL, exportando os resultados para análise. 3. O objetivo é explorar os dados de um banco de clientes utilizando linguagem SQL e serviços de nuvem.

Enviado por

adauri campos
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
Você está na página 1/ 5

Módulo | SQL: Base de dados & Linguagem

SQL
Caderno de Exercícios
Professor André Perez

Tópicos
1. Introdução ao Google Colab;
2. Bases de dados relacionais;
3. Introdução ao SQL;
4. Introdução ao AWS Console;
5. Armazenamento de dados com AWS S3;
6. Computação em SQL com AWS Athena.
Instruções
Neste exercícios, vamos configurar e testar os serviços AWS S3 e AWS Athena da
plataforma de computação em nuvem da AWS para utilizarmos durante todo o curso:

Na etapa de configuração, você deve seguir o passo a passo de configuração do


ambiente, não há entregáveis.

Na etapa de atividades, você deve:

1. Eexecutar a consulta SQL fornecida;


2. Exportar os resultados em um arquivo csv para sua máquina;
3. Renomear o arquivo como query_\.csv;
4. Enviar para a avaliação do tutor na plataforma da EBAC.

Atenção: Substitua o \ numero da consulta, exemplo: query_1.csv.

Configuração
1. Criando a sua conta da AWS
Acesse a plataforma da AWS neste link, clique no botão Criar uma nova conta da AWS e
siga as etapas para a criação da conta. Com a conta pronta, acesse o console da AWS
usando as suas novas credenciais neste link.

Atenção: Lembre-se que você precisa de um cartão de crédito para criar a


sua conta.

2. Configurando o AWS S3
1. Acesse AWS S3;
2. Crie dois buckets:
ebac-\-modulo_1: para os dados;
ebac-\-query-results: para o resultado das consultas do AWS Athena;
3. Faço o upload do arquivo credito-aula.csv no bucket de dados.

Atenção: Substitua o \ pelo seu primeiro nome, exemplo: ebac-


andreperez-modulo_1.

Atenção: Caso o bucket já exista, sinta-se a vontade para escolher o nome


que desejar.

Atenção: O arquivo credito-aula.csv está na plataforma da EBAC.


2. Configurando o AWS Athena
1. Acesse AWS Athena;
2. Configure o local de armazenamento das consultas:

Clique no botão settings;


Preencha o campo Query result location com o nome do bucket (ebac-\-
query-results) criado na etapa anterior;
Clique em salvar.

Atividades
1 Criação da tabela de clientes
No console do AWS Athena, execute a seguinte query:

CREATE EXTERNAL TABLE clientes(


id BIGINT,
idade BIGINT,
sexo STRING,
dependentes BIGINT,
escolaridade STRING,
tipo_cartao STRING,
limite_credito DOUBLE,
valor_transacoes_12m DOUBLE,
qtd_transacoes_12m BIGINT)
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
WITH SERDEPROPERTIES ('separatorChar' = ',', 'quoteChar' = '"',
'escapeChar' = '\\')
STORED AS TEXTFILE
LOCATION 's3://ebac-<seu-nome>-modulo_1/'
No painel de resultados, você deve encontrar o seguinte resultado.

Query successful.

Atenção: No campo LOCATION, substitua o \ pelo seu primeiro nome,


exemplo: ebac-andreperez-modulo_1.

Atenção: Nesta atividade, você não precisa exportar os resultados.

2. Explorando os dados da tabela de clientes


2.1. Query 1
No console do AWS Athena, execute a seguinte query:

SELECT * FROM clientes;


No painel de resultados você deve encontrar o seguinte resultado.

id idade sexo dependentes escolaridade tipo_cartao limite_credito valor_transacoes

768805383 45 M 3 ensino medio blue 12.691,51 1.144,90

818770008 49 F 5 mestrado blue 8.256,96 1.291,45

713982108 51 M 3 mestrado blue 3.418,56 1.887,72

Atenção: Extraia os resultados para o arquivo CSV através do botão de


download e renomei-o com o número da query. Voce deve envia-lo para os
tutores de EBAC.

2.2. Query 2
No console do AWS Athena, execute a seguinte query:

SELECT id, idade, limite_credito FROM clientes WHERE sexo = 'M'


ORDER BY idade DESC;
No painel de resultados você deve encontrar o seguinte resultado.

id idade limite_credito

713982108 51 3418.56

768805383 45 12691.51

Atenção: Extraia os resultados para o arquivo CSV através do botão de


download e renomei-o com o número da query. Voce deve envia-lo para os
tutores de EBAC.

2.3. Query 3
No console do AWS Athena, execute a seguinte query:

SELECT sexo, AVG(idade) AS "media_idade_por_sexo" FROM clientes


GROUP BY sexo;
No painel de resultados você deve encontrar o seguinte resultado.

sexo media_idade_por_sexo

F 49

M 48

Atenção: Extraia os resultados para o arquivo CSV através do botão de


download e renomei-o com o número da query. Voce deve envia-lo para os
tutores de EBAC.

Você também pode gostar