Banc 2
Banc 2
Banc 2
APRENDIZAGEM EM FOCO
2
Para tal, esta disciplina apresentará a você definições sobre
estruturação e modelos de desenvolvimento de um banco de
dados; relações entre entidades de um banco; princípios de
cardinalidade e da linguagem-padrão utilizada. Além disso, será
estudado o que é um sistema responsável pela gestão de bancos
de dados. Você entenderá o que significa armazenamento em
nuvem, tratamento e manipulação de dados, aplicações e quais as
perspectivas futuras para os bancos de dados.
Por fim, para enriquecer ainda mais sua prática profissional, você
estudará sobre Big Data, a tecnologia de informação presente
no mundo todo e em crescente desenvolvimento, mostrando-se
extremamente eficiente na organização, no armazenamento e na
manipulação de enormes volumes de dados originados das mais
variadas fontes, por exemplo, as redes sociais. Além, é claro, de
aprender sobre as principais ferramentas utilizadas em Big Data
para transformar com velocidade e veracidade meros dados
brutos em informações de valor inestimável, como os datas
warehouses, Hadoops e os chamados NoSQL (bancos de dados
não relacionais).
INTRODUÇÃO
3
TEMA 1
INÍCIO
______________________________________________________________
Autoria: Clarissa Fernanda Correia Lima Loureiro
Leitura crítica: Flavio Fiuza
TEMA 1
TEMA 2
TEMA 3
TEMA 4
DIRETO AO PONTO
5
sendo que existe uma coluna que é comum a ambas as tabelas.
Desta forma, existe uma relação entre as tabelas em que o banco
de dados relacional pode estabelecer uma ID que é, neste caso,
uma chave.
Sobre Big Data, temos que a quase totalidade dos dados que
existem hoje foi gerada nos últimos dois anos. Isto significa
que a maior parte dos dados que temos hoje em dia foi gerada
entre 2018 e 2020. A qualidade de câmeras, vídeos e capacidade
de armazenamento de informações nos dispositivos, aliada
aos meios de comunicação, como mídias sociais, e aos novos
hábitos de compartilhamento digitais, fizeram com que cerca
de 8 zetabytes (10²¹ bytes) fossem gerados em 2015. Em 2020,
foram gerados cerca de 350 zetabytes de dados, ou seja, uma
quantidade 43,75 vezes maior.
Essa nova realidade faz com que o Big Data esteja entre os
assuntos mais importantes em termos de soluções globais.
Analisar situações, gerenciar empresas e tomar decisões pode se
tornar mais eficiente com uma análise em Big Data.
6
infraestrutura para armazenar e processar os dados. O Hadoop
é um projeto open source desenvolvido pelos projetos Hadoop
MapReduce (HMR), utilizado para processamento paralelo;
Hadoop Distributed File System (HDFS), utilizados para trabalho
com dados não estruturados.
7
Referências bibliográficas
NAVATHE, E. Sistemas de banco de dados. 6. ed. São Paulo: Pearson, 2011.
TAURION, C. Big Data. Rio de Janeiro, Brasport, 2013.
8
Portanto, se tivermos os mesmos dados armazenados em áreas
diferentes, a empresa incorrerá em maiores custos e queremos
evitar isso. É por isso que falamos que temos de ter cuidado com o
princípio da redundância.
Referências bibliográficas
MEDEIROS, F. L. Banco de dados: princípios e práticas. Curitiba:
Intersaberes, 2013.
9
Lorem ipsum
TEORIA dolor sit amet
EM PRÁTICA
Autoria:
Reflita Nome
sobredo
a autor da disciplina
seguinte situação: você é o diretor da empresa
Leitura
Google, crítica: Nomemuitas
existem do autoráreas
da disciplina
e vários programas que estão
sob a mesma empresa, como os e-mails Gmail, sites de busca,
agendas virtuais, Google Maps, vários aplicativos; a empresa
multinacional, que atua mundialmente, possui um volume
de dados gigantesco, na faixa de zetabytes. Com a maior
parcela de seu lucro vindo da publicidade, é uma das maiores
empresas do mundo, embora seja recente. Foi fundada em
4 de setembro de 1998. O crescimento da empresa foi muito
rápido e, com isso, culminou em diversos produtos inovadores
e tecnológicos no mercado. O Google é executado em mais
de um milhão de servidores e processa mais de 5 bilhões
de solicitações de pesquisa em vários países diferentes. Já
foi tido como o site mais visitado do mundo e considerado
uma das melhores empresas para se trabalhar. Com todas
essas informações sobre o Google, é possível perceber, com o
conteúdo estudado, que estamos tratando do maior volume
de dados do mundo. Quais as características de profissionais
que você contrataria para sua empresa? Quais os princípios
aplicados aos dados que você recomendaria ter para que sua
empresa continuasse a ter sucesso?
10
LEITURA FUNDAMENTAL
Indicações de leitura
Indicação 1
Indicação 2
11
Indicação 3
Indicação 4
12
QUIZ
13
GABARITO
Questão 1 - Resposta A
Resolução: Os princípios são: redundância, inconsistência e
integração, que são um conjunto de regras e princípios para
que o tempo de aquisição das informações estruturadas seja
curto, e o processo, confiável.
Questão 2 - Resposta D
Resolução: Algumas tecnologias dão suporte ao Big Data,
como Hadoop e MapReduce, Cassandra (sistema open
source), muito utilizados pelas redes sociais, na parte de
análise e de infraestrutura, para armazenar e processar os
dados. O Hadoop é um projeto open source, desenvolvido
pelos projetos Hadoop MapReduce (HMR), utilizado para
processamento paralelo; Hadoop Distributed File System
(HDFS), utilizados para trabalho com dados não estruturados.
14
TEMA 2
ACID e benefícios do
banco de dados relacional
INÍCIO
______________________________________________________________
Autoria: Clarissa Fernanda Correia Lima Loureiro
Leitura crítica: Flavio Fiuza
TEMA 1
TEMA 2
TEMA 3
TEMA 4
DIRETO AO PONTO
16
• Durabilidade: quando houver mudanças aplicadas pelas
transações ao banco de dados, estas não podem ser perdidas
por causa de falhas, as mudanças devem ser mantidas.
17
Em relação à cardinalidade, existem dois tipos:
Referências bibliográficas
HARVARD-MIT. MIT-BIH Database Distribution. 2005. Disponível em:
https://ecg.mit.edu/. Acesso em: 16 nov. 2020.
18
que pode ter um impacto positivo entre os funcionários e na
produtividade, sendo estes alguns dos bons resultados que a
empresa pode alcançar:
Referências bibliográficas
LEAL, L. C. G. Linguagem, programação e banco de dados. Curitiba:
Intersaberes, 2015. Cap. 1, p. 15-48.
19
TEORIA EM PRÁTICA
LEITURA FUNDAMENTAL
Indicações de leitura
Indicação 1
20
Indicação 2
QUIZ
21
a. Atomicidade.
b. Consistência.
c. Isolamento.
d. Durabilidade.
e. Coerência.
a. Atomicidade.
b. Consistência.
c. Isolamento.
d. Durabilidade.
e. Coerência.
GABARITO
Questão 1 - Resposta A
Resolução: Atomicidade: uma transação deve ser realizada
em sua totalidade, caso não seja, não deve ser realizada.
Isolamento ou isolação: uma transação deve ser executada
isoladamente, ainda que ao mesmo tempo que outras.
Mesmo acontecendo simultaneamente, não deve sofrer
interferência de outras transações.
22
Questão 2 - Resposta C
Resolução: O isolamento garante que transações
concorrentes não sofram mútua interferência. Noutras
palavras, uma transação em andamento que ainda não
esteja validada deve permanecer isolada de qualquer outra
operação, garantindo que a transação não será interferida
por nenhuma outra.
23
TEMA 3
A SQL e os sistemas de
gestão de banco de dados
INÍCIO
______________________________________________________________
Autoria: Clarissa Fernanda Correia Lima Loureiro
Leitura crítica: Flavio Fiuza
TEMA 1
TEMA 2
TEMA 3
TEMA 4
DIRETO AO PONTO
Para que o uso de um banco de dados (BD) relacional e suas
transações de dados necessárias faça sentido, é preciso que você
tenha em mãos um adequado sistema de gestão de banco de
dados (database management system – DBMS), responsável por
criar, armazenar, organizar e promover acesso aos dados de um
determinado BD (LAUDON; LAUDON, 2014).
25
uma linguagem complexa. Já o módulo servidor está relacionado
às operações técnicas relacionadas ao armazenamento de dados
de modo geral, como acessos e consultas (MACHADO, 2020).
26
1970 e, em virtude de sua expansão em utilização mundial,
tornou-se a linguagem-padrão dos DBMS pela ANSI em 1982 e
pela ISO em 1986 (MACHADO, 2020).
Para Machado (2020), a SQL, que pode ser utilizada por meio de
linguagens hospedeiras (C, C++, Fortran etc.), isenta usuários e
programadores da preocupação relacionada à migração de dados
entre diferentes DBMS. Além disso, a linguagem estruturada em
consulta age como um mediador na troca de dados e informação
entre o banco de dados e processos (consultas interativas;
acessibilidade a um banco de dados específico; otimização da
gestão dos DBAs; relacionamento cliente-servidor; comunicação
entre computadores e máquinas; e a interação com outros
bancos de dados).
27
Indo mais a fundo, a DML pode ainda ser subdividida em linguagem
de alto e baixo nível. A primeira, também conhecida como não
processual, tem a capacidade de entender a consulta solicitada
pelo usuário por meio de uma linguagem de programação geral.
Já a de baixo nível, ou processual, exige ser embutida em uma
linguagem hospedeira por meio de códigos do tipo loop, para que
consiga realizar as tarefas solicitadas, porque tem a capacidade de
processar apenas um dado de cada vez (MACHADO, 2020).
Referências bibliográficas
LAUDON, K.; LAUDON, J. Sistemas de informações gerenciais. Tradução
Célia Taniwaki. 11. ed. São Paulo: Pearson, 2014.
MACHADO, F. N. R. Projeto e implementação de banco de dados. 4. ed.
São Paulo: Érica, 2020.
28
todos os módulos do DBMS possam ter acesso ao banco
de dados. Existem sistemas que contam com um módulo
próprio para gerenciamento de buffers, dispensando o uso
desnecessário do SO (ELMASRI; NAVATHE, 2009).
29
• Loading: carregamento de arquivos de dados. É necessário
fornecer ao utilitário a fonte e a estrutura do dado que
se deseja, formatando ou convertendo os arquivos e os
disponibilizando no BD.
Referências bibliográficas
ELMASRI, R.; NAVATHE, S. B. Sistemas de banco de dados. Tradução Marília
G. Pinheiro. 4. ed. São Paulo: Pearson, 2009.
MACHADO, F. N. R. Projeto e implementação de banco de dados. 4. ed.
São Paulo: Érica, 2020.
TEORIA EM PRÁTICA
30
da cadeia de suprimento e de relacionamento com o cliente,
sistemas de informação que já seriam suficientes para garantir
o sucesso dos processos de negócios. Porém, o banco de dados
que alimenta tais sistemas não possui uma gestão adequada,
causando atrasos e informações desconexas. Você recebe a
missão de resolver esse problema. Como você poderia utilizar
um sistema de gestão de banco de dados estruturado em SQL
nesta situação? E quais utilitários e interfaces são recomendados
para esse sistema?
LEITURA FUNDAMENTAL
Indicações de leitura
Indicação 1
31
Indicação 2
QUIZ
32
a. Módulo automático e módulo manual.
b. Módulo empresarial e módulo pessoal.
c. Módulo integrado e módulo dividido.
d. Módulo cliente e módulo servidor.
e. Módulo de escrita e módulo de leitura.
a. IML e BDR.
b. DLL e DML.
c. BDR e DDL.
d. DML e DVL.
e. DDL e DML.
GABARITO
Questão 1 - Resposta D
Resolução: Os sistemas de gestão de banco de dados são
baseados na relação cliente-servidor. Consequentemente, os
dois principais módulos são o módulo cliente (com interfaces
relacionais com o usuário) e o módulo servidor (para a
realização das operações físicas do banco de dados).
Questão 2 - Resposta E
Resolução: A Data Definition Language (DDL – Linguagem
de Definição de Dados) e a Data Manipulation Language
(DML – Linguagem de Manipulação de Dados) são as
principais sublinguagens da SQL utilizadas para consultas
e/ou manipulação de arquivos do banco de dados,
respectivamente.
33
TEMA 4
INÍCIO
______________________________________________________________
Autoria: Clarissa Fernanda Correia Lima Loureiro
Leitura crítica: Flavio Fiuza
TEMA 1
TEMA 2
TEMA 3
TEMA 4
DIRETO AO PONTO
Com os avanços tecnológicos, o fluxo de dados e informações
cresceu de forma exponencial, o que impossibilitou a utilização
eficiente dos tradicionais bancos de dados relacionais e sistemas
de informação. Com o advento da web, surgiram enormes
volumes de dados gerados em curtos períodos de tempo. Com
isso, o uso de planilhas, por exemplo, tornou-se demasiadamente
obsoleto. Como alternativa eficiente para o gerenciamento desses
imensos volumes, utiliza-se a concepção de Big Data.
1. Volume.
2. Velocidade.
3. Veracidade.
4. Variedade.
5. Valor.
35
utilização deve, obrigatoriamente, passar por três etapas básicas
(LAUDON; LAUDON, 2014). Primeiramente, realiza-se o processo
de coleta de dados das mais variadas fontes possíveis. Esses
dados devem, então, ser tratados, agregados e integrados entre si
para que, ao final, possam ser utilizados em ações analíticas que
descobrirão seus padrões e relações, segundo Taurion (2013).
36
Como observado, Big Data compreende enormes quantidades
de dados das mais variadas fontes, encaminhados aos clusters
Hadoop, para posteriormente serem retrabalhados pelos datas
warehouses e marts e plataformas analíticas, antes de chegar aos
interessados em processar informações importantes (LAUDON;
LAUDON, 2014).
37
Para desenvolver um projeto de Big Data utilizando Hadoop e
obter sucesso, Taurion (2013) acredita que a ferramenta deva
realmente ter utilidade para um setor empresarial, por exemplo,
se a empresa possui a capacidade e qualificação necessária e que
a fornecedora de uma distribuição Hadoop tenha essa ferramenta
como seu principal produto e assim garante-se o suporte.
Referências bibliográficas
LAUDON, K.; LAUDON, J. Sistemas de informações gerenciais. Tradução
Célia Taniwaki. 11. ed. São Paulo: Pearson, 2014.
TAURION, C. Big Data: velocidade, volume, variedade, veracidade, valor.
Rio de Janeiro: Brasport, 2013.
38
Para Tan et al. (2014), o processamento do data mining surge no
momento em que o usuário define um problema, escolhendo os
dados e ferramentas para analisá-lo. Basicamente, são utilizadas
três técnicas para tal situação: estatística, que é a essência
do data mining; inteligência artificial, como forma de imitar a
expertise humana na resolução de problemas; e machine learning
(aprendizado de máquina), com a confecção de algoritmos
capazes de aprender e reconhecer padrões em dados que
auxiliarão a tomada de decisão.
39
As práticas do data mining visam analisar os dados em alto nível
frente à necessidade de obter tendência e padrões. Logo, o
data mining pode ser aplicado em todos os setores funcionais
de uma empresa, em organizações governamentais ou mesmo
na área acadêmica (pesquisas científicas). Evidentemente que a
aplicação mais usual é na identificação de padrões de consumo
e direcionar as informações obtidas às empresas, que podem,
então, promover campanhas de marketing direcionadas ou
simplesmente visualizar quais clientes são potencialmente mais
lucrativos (LAUDON; LAUDON, 2014).
Referências bibliográficas
LAUDON, K.; LAUDON, J. Sistemas de informações gerenciais. Tradução
Célia Taniwaki. 11. ed. São Paulo: Pearson, 2014.
TAN, P. et al. Introduction to data mining: Pearson new international
edition. 1 ed. Londres, 2014.
TEORIA EM PRÁTICA
40
Para conhecer a resolução comentada proposta pelo
professor, acesse a videoaula deste Teoria em Prática no
ambiente de aprendizagem.
LEITURA FUNDAMENTAL
Indicações de leitura
Indicação 1
Indicação 2
41
QUIZ
42
d. De incrementação; sequenciais; de aglomeração;
colaborativas; de seleção.
e. De incrementação; funcionais; emergenciais; valiosas;
de descarte.
GABARITO
Questão 1 - Resposta E
Resolução: Conhecidos como “5 Vs” o volume, a velocidade,
a veracidade, a variedade e o valor são palavras que definem
o que é Big Data e sua concepção.
Questão 2 - Resposta C
Resolução: Os tipos de informações obtidas do data
mining são: associativas, referentes a ocorrências de um
mesmo evento; sequenciais, que ocorrem durante o
evento; classificativas, que definem o perfil de clientes;
de aglomeração, agrupando perfis identificados; e de
prognósticos, que preveem valores a partir da análise de
outros valores.
43
BONS ESTUDOS!