TI Resumo Grátis Banco de Dados
TI Resumo Grátis Banco de Dados
TI Resumo Grátis Banco de Dados
APRESENTAÇÃO
Exponencial Concursos
https://www.youtube.com/channel/UCr9rg5WOPmXvZgOfBl-HEuw
@exponencial_concursos
https://www.instagram.com/exponencial_concursos/?hl=pt-br
@profecoach_ramonsouza
https://www.instagram.com/profecoach_ramonsouza/?hl=pt-br
ASSUNTOS PÁGINA
Banco de Dados
•Auxilia na:
SGBD ▪Definição
▪Construção
(coleção de programas) ▪Manipulação
▪Compartilhamento
▪Proteção
▪Manutenção
BD SGBD SBD
Elsmari e Navathe
(vantagens de usar a abordagem SGBD)
▪Controle de redundância.
▪Restrição de acesso não autorizado.
▪Armazenamento persistente para objetos do programa.
▪Estruturas de armazenamento e técnicas de pesquisa para o
processamento eficiente de consulta.
▪Backup e recuperação.
▪Múltiplas interfaces do usuário.
▪Representação de relacionamentos complexos entre dados.
▪Restrições de integridade.
▪Dedução e ação usando regras.
▪Potencial para garantir padrões.
▪Tempo reduzido para o desenvolvimento de aplicações.
▪Flexibilidade.
▪Disponibilidade de informações atualizadas.
•Economias de escala.
Date
(benefícios da abordagem de BD)
▪O dado pode ser compartilhado.
▪A redundância pode ser reduzida.
▪Inconsistências podem ser evitadas.
▪Pode-se utilizar o suporte a transações.
▪A integridade pode ser mantida.
▪A segurança pode ser aperfeiçoada.
▪Requisitos conflitantes podem ser balanceados.
▪Padrões podem ser utilizados.
Isolamento
executar
Atomicidade
transação
ser realizada dados de um isolada das confirmada
em sua estado demais. devem ser
totalidade ou consistente persistidas
não deve ser para outro. no banco de
realizada de dados.
forma alguma.
Físico
Conceitual
Independente de Totalmente
hardware e software. Dependem do SGBD. dependentes do SGBD.
Descreve a estrutura de
armazenamento físico geralmente
com um modelo físico.
• Capacidade de alterar o esquema interno sem ter de alterar o esquema conceitual e, por
consequência, sem ter que alterar os esquemas externos.
Modelos de Arquitetura de
dados 3 esquemas
Representar os conceitos usados para descrever a Representar as camadas de interação do usuário com o
estruturas dos bancos de dados. banco de dados.
Estruturas de armazenamento
Armazenamento
(usa modelo físico)
Modelo relacional
•Dados como uma coleção de tabelas.
Modelo de objetos
•Dados como objetos, propriedades (atributos) e operações
(métodos).
Modelo objeto-relacional
•SGBD relacional com extensões para modelos de objetos.
Modelo XML
•Estruturas de árvores hierárquicas com uso de tags.
Modelo de rede
•Registros relacionados de forma 1:N.
Modelo hierárquico
•Estruturas de árvores hierárquicas.
Catálogo ou
dicionário de
dados
Metadados ou
informações de
descritor
Estrutura de
Formato de Restrições
cada tipo de Tipo
armazenamento sobre os dados
arquivo
Maneira
Tabela derivada de Tabela virtual: não
alternativa de Consulta pré-
outras tabelas necessariamente
visualização dos definida ou
(tabelas base ou existe em forma
dados de uma ou armazenada.
outras visões). física.
mais tabelas.
Índices
Estrutura
de acesso
auxiliar.
Uso de Utilizados
ponteiros para agilizar
para a
localização
Índice a
recuperação
dos dados. de registros
Chaves
Um para Um
(1:1)
Em bancos relacionais, uma das tabelas
possui a chave estrangeira. Pode-se,
porém, mesclar as entidades em uma única
tabela ou criar uma terceira tabela para
cruzar as chaves primárias destas.
(existem apenas logicamente, mas não fisicamente)
Um para
Muitos
(1:N)
•Está na 2FN.
•Cada atributo não chave não possui dependência transitiva, para cada
chave candidata.
3FN •Todos os atributos dependem exclusivamente da chave primária da tabela.
•Está na 3FN.
•Não possui dependência multivalorada.
4FN
•Está na 4FN.
•Não possui dependência de junção.
5FN
Modelo Entidade-Relacionamento
Modelo
conceitual
Modelo
ER Descrever os dados ou
aspectos de informação de
um domínio de negócio ou
seus requisitos de processo
Entidade.
Entidade
Objetos sobre
os quais deseja-
se manter
informações
Para Heuser,
este é um
relacionamento
Unário, binário pois
autorrelacionamento envolve DUAS
Associação ou relacionamento ocorrências de
entre objetos recursivo uma entidade.
(menos aceita
Relaciona pelas bancas)
mento Binário
Dependendo
da quantidade
de entidades,
podem ser:
Ternário
...
Cardinalidade máxima
Associação opcional
ou participação parcial:
Associação obrigatória
Expressa que uma
ou participação total:
ocorrência de Mesa pode
Expressa que uma
não está associada
Ocorrência de Empregado
a nenhum (0) empregado.
deve estar associado a
Muitos
para Os dados estão diretamente relacionados ao
Muitos fato (ou ao relacionamento), e não as entidades (ou
tabelas).
(N:M)
Entidade fraca
Tipos de atributos
Descritivos
Referenciais
Tipos de atributos
Simples
Quanto à estrutura
Compostos
Obrigatório
Quanto à obrigatoriedade
Opcional
Monovalorados
Quanto à quantidade de valores
Multivalorado
Armazenado
Quanto ao armazenamento
Derivado
Gênero
Espécies
Propriedades
particulares
Entidade associativa
Entidade associativa
Redefinição de um
relacionamento, que
passa a ser tratado
como se fosse também
uma entidade.
SINTAXE DESCRIÇÃO
Entidade (Produto)
Cardinalidade 1
Cardinalidade muitos
Cardinalidade 1:1
Cardinalidade 0:1
Cardinalidade 1:N
Cardinalidade 0:N
SQL
Específica para
Somente o Específica para
armazenament
SELECT visões
o
SELECT CREATE GRANT COMMIT
UPDATE DROP
DELETE
•lista_de_atributos
•condição
•* retorna todos os
atributos. •nome_tabela
•Opcional, mas
geralmente usada.
•DISTINCT elimina
duplicidades.
= igual
< menor
<> diferente
IN possíveis valores
Expressão Resultado
AND
•SELECT coluna1, coluna2, ... FROM nome_da_tabela WHERE condição1
AND condição2 AND condição3 ...;
Instrução SELECT
mais de
uma
condição
Lista de
SELECT FROM tabela WHERE condição ou
atributos
negação
de
condição
<
<=
> AND
coluna1, coluna
2, ...
*
SELECT <> NOT
OU
BETWEEN
SELECT
DISTINCT
coluna1, coluna
2, ... LIKE
FROM tabela
ou
IN
*
Ordem
colunas
crescente
Ordem
ORDER BY colunas ASC
crescente
Ordem
colunas DESC
decrescente
Funções de Agregação
FUNÇÃO RETORNO
MIN Menor valor de uma coluna.
MAX Maior valor de uma coluna.
COUNT Número de linhas que atendem a um critério.
AVG Média dos valores de uma coluna numérica.
SUM Soma dos valores de uma coluna numérica.
condição com
GROUP BY coluna HAVING função
agregadora
INNER JOIN
•Retorna somente os registros que possuem valores relacionados em ambas as tabelas,
isto é, as intersecções.
LEFT JOIN
•Retorna todos os registros da tabela da esquerda, e os registros relacionados da tabela
da direita.
•Preenche campos não relacionados na tabela da direita com NULL.
RIGHT JOIN
•Retorna todos os registros da tabela da direita, e os registros relacionados da tabela da
esquerda.
•Preenche campos não relacionados na tabela da esquerda com NULL
SELF JOIN
•União de uma tabela com ela mesma.
DELETE
FROM WHERE
ou
•nome_tabela •condição (opcional)
DELETE *
•Indicação
das colunas e
•nome_tabela •condição
seus novos
valores.
DDL
CREATE
(criação)
ALTER
Comandos
(alteração)
DROP
(exclusão)
DDL
VDL
(visões)
Sublinguagens
SDL
(armazenamento)
OU
OU
Inclusive a
DROP TABLE nome_da_tabela;
estrutura
Exclusão
Somente os
TRUNCATE TABLE nome_da_tabela;
dados
Regras para
Restrições
os dados
PRIMARY FOREIGN
NOT NULL UNIQUE CHECK DEFAULT INDEX
KEY KEY
Arquitetura de BI
Business Intelligence
Combina arquitetura, ferramentas, bancos de dados, ferramentas analíticas,
aplicações e metodologias com os objetivos de habilitar o acesso interativo aos
dados, habilitar a manipulação desses dados e prover aos gerentes de negócios e
analistas a habilidade de conduzir análises apropriadas
Business Process
Data Warehouse Business Analytics Management User Interface
(BPM)
Ampliam o Fornecem a
Repositório de dados Variedade de
monitoramento, visualização de
atuais e históricos de ferramentas e
medição e dados para os
potencial interesse técnicas para
comparação de gestores. Ex.:
para gestores de toda trabalhar dados e
indicadores de dashboars, cockpits,
a organização. informações.
desempenho. portais.
Orientados a
Integrados Variante no tempo Não voláteis
assunto
•EDW alimenta os data marts departamentais •Data marts são integrados por um barramento
(DW->DM). ou middleware (DM->DW).
•Fornece uma solução técnica baseada em •Entrega uma solução que torna fácil o acesso
métodos e técnicas comprovadas de BD. direto pelos usuários às consultas aos
dados com bons tempos de resposta.
Modelagem dimensional
Modelagem
dimensional
Técnica de modelagem
Permite uso mais intuitivo
de BD utilizada para a
Auxílio às consultas em para o processamento
representação dos dados
um Data Warehouse. analítico pelas ferramentas
nos BDs
OLAP.
multidimensionais.
Modelo Dimensional
Duas ou mais chaves Conectam a tabela fato Única chave primária para
estrangeiras por tabela fato às tabelas dimensão.
cada dimensão
Geralmente simples
Um subconjunto das chaves
estrangeiras pode identificar
unicamente a tabela fato.
Sempre possui
Chave primária composta Dimensão Tempo
Fato transacional
• Mais comuns.
• Linhas representam evento de medição em um ponto no espaço
e no tempo.
Fato agregada
• Sumariza os dados de uma tabela fato.
• Otimiza o tempo de consulta.
• Esforço adicional de manutenação e gasto com
armazenamento.
Fato consolidada
• Agrega duas tabelas fato (dois processos).
• Complexidade extra para o ETL.
Tabela Fato
Tabela Fato
Constelação de fatos
Conjunto de tabelas fato Multiestrela: se for
compartilham dimensões semelhante ao esquema Limitam as consultas ao
comuns (dimensões estrela, mas com mais de Data Warehouse.
conformes). uma tabela fato.
OLTP OLAP
Variações OLAP
• Armazenamento de informações no
cubo de dados.
• Requer pré-computação.
• Ganho de desempenho.
MOLAP • Longo período para carga dos
dados.
• Baixa escalabilidade.
• Permite consultas ad-hoc.
• Alta escalabilidade.
Quanto a origem
da consulta
Slice
Extração de um subcubo.
Dice
Sobe na hierarquia
Aumenta a granularidade.
Desce na hierarquia
Reduz a granularidade.
Drill across
Drill through
Mineração de dados
Mineração de
dados
Não é uma nova disciplina,
(Extração de Utiliza técnicas de estatística, mas uma interseção de muitas
conhecimento, análise matemática e inteligência (estatística, inteligência artificial,
de padrões, artificial. aprendizado de máquinas, ciência de gestão,
arqueologia de dados, sistemas de informação e bancos de dados).
busca de padrões ou
dragagem de dados)
Pesquisas.
Finanças, varejo, marketing,
Amplamente utilizada em
manufatura e saúde.
diversos ramos
Vantagem competitiva
estratégica.
Bancos de dados
muito grandes
Arquitetura
Requer, por vezes, cliente/servidor ou
processamento uma baseada na
paralelo Web
Características Ferramentas
Fácil combinação
da mineração de sofisticadas para
com outras
dados recuperação de
ferramentas
informações
Resultados
inesperados e Consultas sem
exigência de conhecimento de
pensamento criativo programação
❖ Também compreende a
avaliação e comparação das
análises realizadas com os
diversos modelos construídos.
Análise de ligações
Associação
Padrões sequenciais
Descobrir
relacionamentos
entre variáveis em Uma sequência de ações ou
grandes bancos de eventos é buscada.
dados.
Classes são
As similaridades entre os
previamente
dados podem ser detectadas
desconhecidas.
dentro de posições de uma
série temporal.
Agrupamento
(clusterização)
Análise de outliers
Partição de uma
coleção de eventos ou Identificação dos dados que
itens em segmentos não apresentam o
cujos membros são comportamento padrão.
características
semelhantes.
Processo de aprender
um modelo que Classes pre-
descreve diferentes definidas.
classes de dados.
Classificação
Ferramentas
comuns
Aprendizado
Estatística Emergentes
de máquina
Máquinas
Árvores Análise Conjuntos de Algoritmo
Redes Regressão
de discrimina aproxima vetores s
neurais loigística
decisão tória dos de genéticos
suporte
Associação
Regras de associação
PP-
Growth,
Análise de Padrões de Suporte ou Confiança
Apriori OneR,
ligações sequência prevalência ou força
ZeroR e
Eclat.
Agrupamentos
(clusterização)
Dados semi-
Dados não estruturados
estuturados
Ex.:
Documentos
do Word,
arquivos PDF,
trechos de
texto, arquivos
XML
2ª etapa
Captura, gerenciamento e a
Conjuntos de dados muito
análise de dados que vão além
grandes ou complexos
dos dados tipicamente estruturados
Big Data
Aplicativos de processamento de
Frequentemente são dados obtidos
dados tradicionais ainda não
de arquivos não estruturados
conseguem lidar
Informações Verdadeiras
Veracidade
Proveniência ou à confiabilidade da fonte de
dados.
Valor
Custos não devem ser superiores aos
benefícios.
Padrões
atômicos
Consum Armazenament
o Processamento Acesso
o
Dados
Análise de Dados da web e
Visualização estruturados e
dados históricos mídias sociais
distribuídos
Dados não
Descoberta ad- Análise Dados de
estruturados e
hoc avançada dispositivos
distribuídos
Aumentar os Dados de
Pré-
armazenament warehouse, Dados
processamento
os de dados operacionais e tradicionais
de dados brutos
tradicionais transacionais
Dados em
Notificações Análise ad-hoc
nuvem
Iniciar resposta
automatizada
Padrões de consumo
Aumentar os
Iniciar
Descoberta armazenament
Visualização Notificação resposta
ad-hoc os de dados
automatizada
tradicionais
Pré-
•Para executar a análise em quaisquer dados, eles devem estar
processamento
em algum tipo de formato estruturado.
de dados brutos
Padrões de acesso
Hadoop
Suprojetos Hadoop
Modelo de programação e um
arcabouço especializado no
Programador não precisa se
processamento de conjuntos de
preocupar com o paralelismo.
dados distribuídos em um
aglomerado computacional (cluster).
MapReduce
Sistema de arquivos
distribuído nativo do
Hadoop
Utiliza o modelo
WORM (write-once-
read-many)
HDFS
Interfaces para os
aplicativos
(Hadoop Distributed
File-System)
Localiza a lógica de
processamento
próxima dos dados
Restringe a gravação
dos dados
rigorosamente a um
gravador por vez.
Spark
Suporta operações MapReduce, consultas SQL (SPARKSQL),
streaming de dados (SPARK Streamming), aprendizado de
máquina (MLlib) e processamento de grafos (GraphX).