2362 - Banco de Dados
2362 - Banco de Dados
2362 - Banco de Dados
Tópicos Abordados:
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
SUMÁRIO
Introdução.................................................................................................03
1.0 – Banco de Dados...............................................................................04
2.0 – Sistema Gerenciador de Banco de Dados........................................04
2.1 – Modelo de Dados.................................................................05
2.2 – Tipos de Arquiteturas...........................................................07
2.3 – Capacidades do SGBD.........................................................08
3.0 – Arquiteturas de Banco de Dados......................................................09
3.1 – Aspectos Relevantes.............................................................10
3.2 – Vantagens dos Bancos de Dados..........................................11
3.3 – Linguagens de Base de Dados..............................................12
4.0 – O que é Modelo de Dados?..............................................................12
4.1 – Modelo Entidade Relacionamento.......................................12
4.2 – Entidades e Atributos...........................................................12
4.2.1 – Tipos de Atributos..............................................13
4.3 – Relacionamentos...................................................................15
4.4 – Entidade Fraca......................................................................19
4.5 – Modelo de Entidade Relacionamento Extendido.................20
4.5.1 – Especialização e Generalização...........................20
4.6 – Operações..............................................................................22
5.0 – Tipos de Sistemas Gerenciadores de Banco de Dados......................23
5.1 – dBase......................................................................................23
5.2 – MySQL..................................................................................25
5.3 – PostgreSQL ...........................................................................29
5.4 – Oracle.....................................................................................31
5.5 - Microsoft SQL Server.............................................................31
5.6 - Microsoft Access...................................................................32
5.7 - Data Warehouse.....................................................................34
5.7.1 – Metadado..............................................................37
5.7.2 - Data Mart.............................................................38
5.7.3 - Data Mining.........................................................43
6.0 – Alguns Conceitos Importantes...........................................................51
7.0 - Conclusão..........................................................................................55
8.0 - Bibliografia........................................................................................56
2
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
INTRODUÇÃO
3
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
O termo Banco de Dados foi criado para indicar coleções organizadas de dados
armazenados em computadores digitais; utilizando um conceito, Banco de Dados ou
Bases de Dados são conjuntos de dados integrados com uma estrutura que organizam
informações. Sendo essas informações utilizadas normalmente para um mesmo fim. Um
banco de dados é usualmente mantido e acessado por meio de um software conhecido
como SGBD.
Estritamente falado, o termo Banco de Dados deve ser aplicado apenas aos dados,
enquanto o termo Sistema Gerenciador de Bancos de Dados deve ser aplicado ao
software com a capacidade de manipular bancos de dados de forma geral. Porém, é
comum misturar os dois conceitos.
O que é um SGBD?
4
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
Modelo Hierárquico
Modelo em Rede
Modelo Relacional
O modelo relacional é uma teoria matemática desenvolvida por Edgar Frank Codd
que surgiu na década de 1970, para descrever como as bases de dados devem funcionar.
Porém, a implementação do modelo exigia pesquisas e só na década de 1980 eles iam
começar a ganhar o mercado, se estabilizando totalmente como líder do mercado a partir
da década de 1990.
5
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
Embora esta teoria seja a base para o software de bases de dados relacionais, muito
poucos sistemas de gestão de bases de dados seguem o modelo de forma restrita e todos
têm funcionalidades que violam a teoria, desta forma variando a complexidade e o
poder. A discussão se esses bancos de dados merecem ser chamados de relacional ficou
esgotada com tempo, com a evolução dos bancos existente.
De acordo com a arquitetura ANSI / SPARC em três níveis, os bancos de dados
relacionais possuem três camadas: um conjunto de visões compondo o nível externo;
uma coleção de estruturas de dados, a saber relações, compondo o nível conceitual; um
conjunto de índices ou métodos de acesso a dados armazenados, compondo o nível
interno.
A teoria relacional de banco de dados define um conjunto de operações lógicas, a
saber a álgebra e o cálculo relacionais. Essas operações são a base da linguagem SQL.
Um dos pontos fortes do modelo relacional de banco de dados é a possibilidade de
definição de um conjunto de restrições de integridade. Estas definem os conjuntos de
estados e mudanças de estado consistentes do banco de dados, determinando os valores
que podem e os que não podem ser armazenados.
Diferentemente dos bancos de dados em rede, nos bancos de dados relacionais os
relacionamentos entre as tabelas não são codificados explicitamente na sua definição.
Em vez disso, se fazem implicitamente pela a presença de atributos chave. Como
resultado, bancos de dados relacionais podem ser reorganizados e utilizados de maneira
flexível e de formas não previstas pelos projetistas originais. Por causa dessa
flexibilidade, muitos bancos de dados são baseados no modelo relacional, embora
imperfeitamente.
O modelo relacional apareceu devido às seguintes necessidades: aumentar a
independência de dados nos sistemas gerenciadores de banco de dados; prover um
conjunto de funções apoiadas em álgebra relacional para armazenamento e recuperação
de dados. Modelo que revelou-se ser o mais flexível e adequado ao solucionar os vários
problemas que se colocam no nível da concepção e implementação da base de dados. A
estrutura fundamental do modelo relacional é a relação (tabela). Uma relação é
constituída por um ou mais atributos (campos) que traduzem o tipo de dados a
armazenar. Cada instância do esquema (linha) é chamada de tupla (registro). O modelo
relacional não tem caminhos pré-definidos para se fazer acesso aos dados como nos
modelos que o precederam. O modelo relacional implementa estruturas de dados
organizadas em relações. Porém, para trabalhar com essas tabelas, algumas restrições
precisaram ser impostas para evitar aspectos indesejáveis, como: Repetição de
informação, incapacidade de representar parte da informação e perda de informação.
Essas restrições são: integridade referencial, chaves e integridade de junções de
relações.
6
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
Arquitetura Centralizada
Arquitetura Cliente-Servidor
7
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
Controle de Redundância
Compartilhamento de Dados
Quando múltiplos usuários compartilham uma base de dados, é comum que alguns
usuários não autorizados não tenham acesso a todas as informações da base de dados.
Por exemplo, os dados financeiros são freqüentemente considerados confidenciais e,
desse modo, somente pessoas autorizadas devem ter acesso. Além disso, pode ser
permitido a alguns usuários, apenas a recuperação dos dados. Já, para outros, são
permitidas a recuperação e a modificação. Assim, o tipo de operação de acesso -
recuperação ou modificação - pode também ser controlado. Tipicamente, usuários e
grupos de usuários recebem uma conta protegida por palavras chaves, que é usada para
se obter acesso à base de dados, o que significa dizer que contas diferentes possuem
restrições de acesso diferentes. Um SGBD deve fornecer um subsistema de autorização
e segurança, que é usado pelo DBA para criar contas e especificar restrições nas contas.
8
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
O SGBD deve então obrigar estas restrições automaticamente. Note que um controle
similar pode ser aplicado ao software do SGBD.
Devido aos vários tipos de usuários, com variados níveis de conhecimento técnico,
um SGBD deve fornecer uma variedade de interfaces para atendê-los. Os tipos de
interfaces incluem linguagens de consulta para usuários ocasionais, interfaces de
linguagem de programação para programadores de aplicações, formulários e interfaces
dirigidas por menus para usuários comuns.
Uma base de dados pode possuir uma variedade de dados que estão inter-
relacionados de muitas maneiras. Um SGBD deve ter a capacidade de representar uma
variedade de relacionamentos complexos entre dados, bem como recuperar e modificar
dados relacionados de maneira fácil e eficiente.
Um SGBD deve fornecer recursos para restauração caso ocorram falhas de hardware
ou software. O subsistema de backup e restauração do SGBD é o responsável pela
restauração. Por exemplo, se o sistema de computador falhar no meio da execução de
um programa que esteja realizando uma alteração complexa na base de dados, o
subsistema de restauração é responsável por assegurar que a base de dados seja
restaurada ao estado anterior ao início da execução do programa. Alternativamente, o
subsistema de restauração poderia assegurar que o programa seja reexecutado a partir do
ponto em que havia sido interrompido.
9
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
10
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
o Projeto de uma interface ágil e com uma "rampa ascendente" para propiciar
aprendizado suave ao usuário, no intuito de minimizar o esforço cognitvo;
o Flexibilidade
11
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
implementar uma nova base de dados pode tomar mais tempo do que escrever uma
simples aplicação de arquivos especializada. Porém, uma vez que a base de dados esteja
em uso, geralmente o tempo para se criar novas aplicações, usando-se os recursos de um
SGBD, é bastante reduzido. O tempo para se desenvolver uma nova aplicação em um
SGBD é estimado em 1/4 a 1/6 do que o tempo de desenvolvimento, usando-se apenas o
sistema de arquivos tradicional, devido às facilidades de interfaces disponíveis em um
SGBD.
Tão logo um usuário modifique uma base de dados, todos os outros usuários
“sentem” imediatamente esta modificação. Esta disponibilidade de informações
atualizadas é essencial para muitas aplicações, tais como sistemas de reservas de
passagens aéreas ou bases de dados bancárias. Isso somente é possível devido ao
subsistema de controle de concorrência e restauração do SGBD.
o Economia de Escala
12
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
Uma entidade representa um objeto do mundo real que possui existência própria e
cujas características ou propriedades desejamos armazenar. O objeto representado pode
ser um objeto concreto (uma pessoa, um carro, um livro, etc) ou abstrato (um
departamento, um projeto, um curso). As características do objeto que desejamos
armazenar damos o nome de atributos. Cada atributo de uma entidade possui um nome e
um valor especifico.
EMPREGADO
FUNCIONÁRIO
o Atributos compostos
Podem ser divididos em várias partes (sub-atributos) com significados
independentes. O atributo Endereço de um funcionário, por exemplo, pode ser dividido
em Rua, Número e Bairro.
NÚMERO
BAIRRO
RUA
ENDEREÇO
TELEFONE
NOME
FUNCIONÁRIO 13
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
o Atributos Monovalorados
São aqueles que possuem apenas um valor para aquela entidade.
o Atributos multivalorados
Podem assumir diversos valores. Como por exemplo o atributo Telefone de um
funcionário já que pode assumir diversos valores.
NÚMERO
BAIRRO
RUA
ENDEREÇO
TELEFONE
NOME
FUNCIONÁRIO
o Atributos derivados:
Em alguns casos, dois ou mais atributos estão relacionados, por exemplo, a idade e
data de nascimento de um funcionário. Para um determinado funcionário, podemos
determinar a sua idade por meio da data de nascimento e da data atual. Atributos como a
idade são chamados de atributos derivados, ao contrário dos atributos que chamamos de
armazenados.
NÚMERO
BAIRRO
RUA
ENDEREÇO
D. NASCIMENTO
NOME TELEFONE
IDADE
FUNCIONÁRIO
14
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
Os valores correspondentes dos atributos de duas entidades não podem ser todos
iguais. A lista de atributos de um conjunto de entidades deve ser suficiente para
caracterizar completamente qualquer entidade do conjunto. Essas considerações nos
levam ao conceito de atributo-chave:
o Atributo-chave
Tipo de atributo cujos valores são distintos para cada entidade em um conjunto de
entidades. O RG de um funcionário, por exemplo, constitui um atributo-chave para o
tipo de entidades FUNCIONÁRIO. Algumas vezes, um conjunto de atributos pode
formar uma chave. Mais do que isso, alguns tipos de entidades podem ter mais que um
atributo-chave.
NÚMERO
BAIRRO
RUA
ENDEREÇO
TELEFONE
NOME
Nº DO RG
CPF FUNCIONÁRIO RG
ÓRGÃO EXP.
4.3 – Relacionamentos
15
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
TELEFONE NOME
ENDEREÇO
NOME
NÚMERO
o Grau de um relacionamento
PEÇA
16
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
o Atributos de um relacionamento
Assim como no caso das entidades, relacionamentos também podem possuir certos
atributos. O número de horas que um funcionário trabalha em um projeto, por exemplo,
pode ser visto como um atributo do relacionamento DESENVOLVE.
HORAS
o Papéis em um relacionamento
ENDEREÇO
TELEFONE SUPERVISOR
FUNCIONÁRIO SUPERVISIONADO
NOME SUPERVISIONADO
17
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
o Cardinalidade de um relacionamento(Binário)
TELEFONE NOME
ENDEREÇO
1 1
FUNCIONÁRIO GERENCIA DEPARTAMENTO
NOME
NÚMERO
o Restrição de Participação
18
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
TELEFONE NOME
ENDEREÇO
NOME
NÚMERO
19
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
NOME
TELEFONE
ENDEREÇO
NOME
PARENTESCO
20
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
NÚMERO
BAIRRO
RUA
ENDEREÇO
NOME
TELEFONE
CPF FUNCIONÁRIO
GRAU ESCOLAR
MINISTRA
CURSO
21
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
4.6 – Operações:
o Insert
A operação Insert prove uma lista de valores de atributos de uma nova tupla a ser
inserida em uma relação.
Exemplo: Insert <José, 68760317502, 09/09/1979, 2> em FUNCIONÁRIO.
o Delete
A operação Delete executa a remoção de uma ou mais tuplas especificadas por meio
de condições associadas a determinados atributos da relação.
Exemplo: Delete a tupla de FUNCIONÁRIO com CPF = '68760317502’.
o Update
Cada uma das três operações acima pode violar uma ou mais restrições de
integridade. A operação Insert, por exemplo, pode violar quatro restrições integridade
(de domínio, de chave, de integridade e de integridade referencial). Quando isso
ocorre, é comum rejeitar a inserção da nova tupla. Com relação a operação Delete, ela
pode violar a restrição de integridade referencial. Quando isso ocorre, ou a operação de
remoção é rejeitada ou propagada por meio da remoção das tuplas que referenciam a
tupla inicialmente removida.
Assim como a Insert, a operação Update também pode violar as quatro restrições de
integridade citadas.
5.1 - dBASE
dBASE foi o primeiro SGBD largamente utilizado industrialmente, pelo Apple II,
Apple Macintosh e PC's IBM para DOS, onde se tornou um dos softwares mais
vendidos durante alguns anos. O dBASE nunca conseguiu migrar com sucesso para a
plataforma Microsoft Windows, e foi, em alguns casos, substituído por novos produtos,
como Paradox, Clipper, FoxPro e Microsoft Access. dBase foi vendido para a Borland
em 1991, que vendeu os direitos da linha de produtos, em 1999, para a recém-formada
dBASE Inc.
22
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
A partir de meados dos anos oitenta, muitas outras companhias produziram seus
próprios "dialetos" ou variações do produto e da linguagem. Entre esses, estão: FoxPro
(atual Visual FoxPro), Arago, Force, Recital, dbFast, dbXL, QuickSilver, Clipper,
xBase++, FlagShip e Harbour. Todos foram chamados de xBase.
O formato de arquivo do dBase, o DBF, é muito usado por diversos aplicativos que
precisam somente de um formato para armazenar seus dados estruturadamente.
A licença do dBase foi entregue aos usuários com a validade de 50 anos,
prevenindo-se contra a improvável chance de um usuário utilizar sua cópia do dBase
por um extenso período de tempo.
Ä Origens
Depois deportar o Vulcan para o IMSAI 8080 e depois para o CP/M e MS-DOS
(como dBase), Ratliff adicionou comandos para acomodar a interface de vídeo, bem
como comandos mais avançados para controle de fluxo (tais como DO WHILE /
ENDDO) e lógica condicional (tais como IF / ENDIF).
Para manipulação de dados, dBase oferecia comandos e funções procedurais
sofisticados para abrir e pesquisar arquivos (p.ex: USE, SKIP, GO TOP, GO BOTTOM,
e GO recno), manipular o valor de campos (REPLACE e STORE), e manipular strings
(p.ex.: STR() e SUBSTR()), números e datas. Sua capacidade de abrir e manipular
simultaneamente diversos arquivos contendo dados relacionados levou a Ashton-Tate a
rotular o dBase como uma "base de dados relacional", muito embora o produto não
atendesse os critérios definidos pelo modelo relacional do Dr. Edgar F. Codd.
O dBase era uma linguagem interpretada, que permitia ao usuário executar
comandos digitando-se em uma linha de comando. Digitando um comando e
pressionando a tecla Entra, o interpretador imediatamente iria executá-lo. De maneira
similar, programas (arquivos texto com extensão PRG) rodavam em um interpretador
(com o comando DO), onde cada comando e variável eram processados em tempo de
execução. Isso fazia com que os programas dBase fossem simples e rápidos de escrever
e testar porque os programadores não tinham que primeiro compilá-los antes de
executá-los. (Em outras linguagens, esses passos eram tediosos nos tempos das CPUs
com apenas algumas dezenas de megahertz). O interpretador também gerenciava
automaticamente e dinamicamente a memória (não havia pré-alocação de memória nem
23
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
notação hexadecimal), o que, mais do que outras funcionalidades, tornava possível para
um usuário sem experiência de programação desenvolver aplicações.
Por outro lado, a facilidade de uso e a simplicidade apresentada pelo dBase começou
a se tornar uma limitação à medida que seus usuários tornavam-se mais especializados e
programadores profissionais eram chamados para utilizá-lo. Aplicações mais complexas
e mais críticas demandaram funcionalidades de programação profissional para maior
robustez e desempenho, bem como maior produtividade do programador.
Com o tempo, os competidores da Ashton-Tate introduziram os chamados produtos
e compiladores "clones", que introduziam funcionalidades de programação mais
robustas, tais como funções definidas pelo usuário (UDFs) para complementar as
funções básicas contidas no produto, variáveis com escopo definido, com menor
possibilidade de serem afetadas por processos externos, arrays para manuseio de dados
complexos, funcionalidades de empacotamento para a entrega de aplicações na forma de
arquivos executáveis sem interpretadores em tempo de execução, sintaxe orientada a
objeto, e interfaces para o acesso aos dados de gerenciadores de bancos de dados
externos. A Ashton-Tate também implementou diversas dessas funcionalidades, com
graus variáveis de sucesso. A Ashton-Tate e seus competidores também começaram a
incorporar SQL, a linguagem padrão ANSI/ISO para criação, alteração e recuperação de
dados armazenados em SGBDs.
No final dos anos 1980, grupos de desenvolvedores criaram um padrão para a
linguagem dBase (IEEE 1192). Foi então que a linguagem passou a ser chamada de
"Xbase" para distinguí-la do produto da Ashton-Tate. Centenas de livros foram escritos
sobre programação dBase e Xbase.
Atualmente, implementações da linguagem dBase incluem muitas funcionalidades
direcionadas para aplicações de negócios, incluindo a manipulação de interface de
usuário gráfica (GUI), manipulação de dados remotos e distribuídos, uso da Internet e
interação com dispositivos modernos. A despeito de sua funcionalidade e facilidade de
uso, o legado da linguagem dBase de ter sido "embutida" dentro de um produto
comercial popular é uma das razões pela qual ela não é um padrão dominante hoje em
dia.
Um dos maiores legados do dBase é seu formato de arquivo .dbf, que foi
amplamente adotado.
O sistema de banco de dados dBase foi um dos primeiro a prover uma seção de
cabeçalho (header) para descrever a estrutura dos dados dentro do arquivo. Isso
significa que o programa não mais necessitava conhecimento avançado da estrutura de
dados, mas poderia perguntar diretamente ao arquivo de dados como este estava
estruturado.
24
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
5.2 - MySQL
Ä História do MySQL
25
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
26
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
Ä Características do MySQL
Ä Segurança no MySQL
Ä O MySQL é gratuito?
Pessoas confundem "free" com "grátis" o que é comum aqui no Brasil. Mas em se
tratando de software este "free" é de open source e não gratuito. Para poder utilizar o
MySQL sob a licença GPL e não precisar pagar, o produto desenvolvido precisa ser
GPL também, senão, orientamos a compra da licença comercial, com baixo custo, sendo
comercializada por servidor, sem limites de usuários e processadores e ainda com
garantia perpétua de atualização de versão para o resto da vida.
27
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
O MySQL é regido pela licença GPL, portanto é open source. Muitas e analisarmos o
investimento necessário para aquisição do mesmo, podemos dizer que cabe como uma
solução departamental. Entretanto o que muitos assustam é que empresas como Nasa,
Cisco, Telefônica da Suécia, Yahoo Finance, Nokia e outras mais tem utilizado o
MySQL em aplicações de missão crítica.
Ä COMANDOS
o CREATE DATABASE
Cria um banco de dados. Este comando cria uma área lógica, diretório, onde estarão
armazenadas todas as tabelas do banco de dados.
Ex: mysql>CREATE DATABASE funcionários;
o DROP DATABASE
o CREATE TABLE
o ALTER TABLE
Altera Tabela
Ex: mysql>ALTER TABLE alunos ADD COLUMN turno char(10) NOT NULL
o DROP TABLE
o INSERT
28
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
o SELECT
Comando usado para recuperar valores de uma tabela. Este poderoso comando, em
conjunto com funções, possibilita a recuperação de qualquer valor de uma tabela.
Ex: mysql>SELECT * FROM alunos where nome='Fred Cox Junior';
mysql>SELECT matricula,turno FROM alunos ORDER BY matricula asc;
o DELETE
Apaga registros em uma tabela. Se não for especificada a condição where, todos os
dados serão apagados.
Ex: Mysql>DELETE FROM alunos WHERE turno='Manhã';
o UPDATE
5.3 - PostgreSQL
29
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
30
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
5.4 - Oracle
O sistema gerenciador de banco de dados Oracle surgiu no final dos anos 70,
quando Larry Ellison vislumbrou uma oportunidade que outras companhias não haviam
percebido, quando encontrou uma descrição de um protótipo funcional de um banco de
dados relacional e descobriu que nenhuma empresa tinha se empenhado em
comercializar essa tecnologia.
Ellison e os co-fundadores da Oracle Corporation, Bob Miner e Ed Oates,
perceberam que havia um tremendo potencial de negócios no modelo de banco de dados
relacional tornando assim a maior empresa de software empresarial do mundo.
O SGBD da Oracle é líder de mercado. O Oracle 9i foi pioneiro no suporte ao
modelo web. O Oracel 10g, mais recente, se baseia na tecnologia de grid.
Além do base de dados, a Oracle desenvolve uma suíte de desevolvimento chamada
de Oracle Developer Suite, utilizada na construção de programas de computador que
interagem com a sua base de dados.
A Oracle também criou a linguagem de programação PL/SQL, utilizada no
processamento de transações.
31
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
Ä Utilização
32
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
Ä Características
Ä Desenvolvimento
33
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
Ä Características
34
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
pela função desempenhada por cada setor a fim de suprir as necessidades de controle
das informações do dia a dia da entidade.
o Integrado
o Variante no Tempo
o Não Volátil
35
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
Ä Arquitetura de armazenamento
Ä Modelagem
5.7.1 – Metadado
Todo elemento de dado precisa ser identificado, sua origem ou o processo que o
gera. Esta identificação é muito importante no caso de se necessitar saber informações
sobre a fonte geradora do dado. Esta informação deve ser única, ou seja, cada dado deve
ter uma e somente uma fonte de origem.
36
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
o Fluxo do dado
Todo elemento de dado precisa ter identificado os fluxos nos quais sofre
transformações. É importante saber que dados servem de base para que processos.
Todo elemento de dados deve ter identificado seu tamanho e tipo de dado.
o Nomes e alias
Todo elemento de dados deve ser identificado por um nome. Este nome pode ser da
‘área de negócios’ ou um nome técnico. No caso de serem usados alias para os nomes,
pode-se ter os dois. Devem existir padrões para criação de nomes e alias (ex.:
convenções para abreviações), evitando assim ambigüidades.
o Definiçôes de negócio
Estas definições são as informações mais importantes contidas nos metadados. Cada
elemento de dado deve ser suportado por uma definição do mesmo no contexto da ‘área
de negócio’. O método de manutenção destas informações também deve ser muito
consistente, de forma que o usuário possa obter facilmente definições para as
informações desejadas. Nestas definições devem ser evitadas referências a outros
metadados que necessitem de uma segunda pesquisa para melhor entendimento.
o Regras de transformação
São consideradas como sendo as Regras de Negócio codificadas. Estas regras são
geradas no momento da extração, limpeza e agrupamento dos dados dos Sistemas
Operacionais. Cada regra de transformação codificada, deve estar associada a um
elemento de Metadado. Se mais de uma aplicação contiver a mesma regra de
transformação, deverá ser garantido que estas sejam idênticas.
o Requisitos de teste
37
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
o Triggers automáticos
Deve ser identificado o responsável por cada elemento de dados do Data Warehouse
e também o responsável pela entrada de metadados.
o Acesso e segurança
38
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
Não se pode dizer que um Data warehouse é um conjunto de Data Marts. Seria o
mesmo que dizer que o armazém geral de um supermercado, onde todos os itens vão
antes de seguir para as lojas, é o agrupamento de supermercados.
Ä Extração de Dados
Os dados introduzidos num Data Warehouse geralmente passam por uma área
conhecida como área de stage. O stage de dados ocorre quando existem processos
periódicos de leitura de dados de fontes como sistemas OLTP. Os dados podem passar
então por um processo de qualidade, denormalização e gravação dos dados no Data
Warehouse. Esse processo geralmente é realizado por ferramentas ETL.
Ä OLAP
39
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
Ä Tipos de OLAP
o OLAP Multidimensional
o OLAP Híbrido
Não há consenso claro na indústria sobre o que é "OLAP Híbrido", exceto que um
banco de dados vai dividir dados entre armazenamento relacional e especial. Para
alguns fornecedores, por exemplo, um banco de dados HOLAP usa tabelas para manter
as grandes quantidades de dados detalhados, e um armazenamento especializado para
pelo menos alguns aspectos dos dados das quantidades menores, que são menos
agregadas ou detalhadas.
Cada tipo tem suas características, apesar de não haver consenso sobre os detalhes
dos benefícios entre os fornecedores. MOLAP é melhor com pequenas bases de dados,
calcula rapidamente as agregações e repostas e precisa de menos espaço de
armazenamento.
ROLAP é considerado mais escalável. Entretanto, é difícil implementar
eficientemente um pré-processamento para grandes volumes e por isso é frequentemente
deixado de lado. A performance das consultas ROLAP pode, portanto, sofrer com
grandes volumes.
HOLAP está entre os dois em todas as áreas, mas tem um pré-processo rápido e
escalona bem. Todos os tipos estão sujeitos à explosão de bases de dados. Esse
fenômeno causa a alocação de grandes volumes de memória pelas bases OLAP, quando
certas (e frequentes) condições são satisfeitas: grande número de dimensões, resultados
pré-calculados e dados multidimensionais esparsos. A dificuldade em implementar
40
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
41
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
Ä Business intelligence
o Processo Empresarial
o Tecnologia de BI
42
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
cada um contém. É nesse sentido, que cada pode considerar um sistema de BI como um
sistema de suporte para tomada de decisão (decision-support system).
o Tipos de software
As pessoas que trabalham com o BI tem que desenvolver ferramentas em cada caso,
especificadamente quando a inteligência envolve recolhimento e análise de largas
quantidades de dados desestruturados. Existem inúmeros softwares para gerenciamentos
destas informações, em diversas categorias. Uma pesquisa nas ferramentas de busca da
internet podem trazer diversas informações sobre cada um destes programas.
43
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
o Seleção
o Pré-processamento
Esta é a fase de limpesa dos dados onde sertas informações são removidas desde que
sejam julgadas desnecessárias. Estas informações não pertinentes podem reduzir a
velocidade de “queries” como por exemplo é desnecessário notar o sexo de um paciente
quando está estudando gravidez. Também os dados são reconfigurados para assegurar
um formato consistente pois há uma possibilidade de formatos incompatíveis. Isto
porque os dados são tirados de várias fontes, como exemplo, sexo pode ser registrado
como “F” ou “M” e também como como “1” ou “0”.
o Transformação
Os dados não são somente transferidos mas transformados em dados úteis, tais como
dados demográficos comumente usados em pesquisas de mercado. Então os dados
tornam-se utilizáveis e navegáveis.
o Data Mining
Esta fase se preocupa com a extração de padrões de dados. Um padrão pode ser
definido como determinado conjunto de fatos(dados) F, uma linguagem L, e alguma
medida de certeza C. Um padrão é uma declaração S em L que descreve relações entre
conjuntos F’s de F com uma certeza C tal aquele S é mais simples em um sensação que
a enumeração de todos os fatos em F’s.
o Interpretação e avaliação
44
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
de relações implicítas e padrões entre os dados que nam sempre são visíveis através da
simples observação. Há três razões principais para se desenvolver um projeto em Data
Mining.
Muitas vezes as empresas descobrem que seus dados são imcompletos, errados ou
contraditórios. Decorre disso a necessidade de obter dados cada vez mais consistentes
para processamento e análise futura.
45
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
o Visão Conceitual
o Visão em Camadas
46
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
ð Arquitetura em camadas.
Tem a função de gerenciar a transmissão das informações pelo ambiente de rede que
serve de suporte para o sistema como um todo, separando as aplicações operacionais do
formato real dos dados, realiza ainda a coleta de mensagens e transações e se encarrega
de entregá-las nos locais e nos tempos determinados;
47
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
A respeito da disposição física dos dados, o DW pode ter uma estrutura centralizada
em um único local ou então ser implementado de forma distribuída. Se optarmos pelo
modelo centralizado, teremos um warehouse consolidado e o Banco de Dados formará
um DW integrado. Definindo o projeto desta forma pode-se maximizar o poder de
processamento e acelerar os processos de busca por informações analíticas.
Definindo-se uma arquitetura federativa, pode-se distribuir a informação por função,
separando os dados do setor financeiro em um servidor, os dados de marketing em outro
local, e dados de manufatura em um terceiro lugar.
Existe ainda uma terceira metodologia, na qual considera-se uma arquitetura de DW
separada por camadas, armazenando os dados mais resumidos em um servidor,
dispondo os dados um pouco mais detalhados, em nível de detalhe intermediário, em
um segundo servidor, e por fim colocamos os dados mais detalhados (atômicos) em um
terceiro servidor.
48
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
Ä Granularidade em camadas
O primeiro servidor geralmente atende à maior parte das consultas, sendo que
teremos um menor número de pedidos de acesso solicitados para a camada 2 e camada
3.
O dimensionamento dos servidores é o seguinte: na primeira camada podemos ter
uma configuração para suportar um grande número de usuários que farão diversas
consultas, as quais trabalharão com um volume relativamente pequeno de dados. Já os
servidores das outras duas camadas devem ser configurados para permitir processar
grandes volumes de dados, porém não é necessária uma preocupação em configurar o
sistema para suportar o acesso de um número maior de usuários. Isto explica-se pelo
fato de que a maioria dos usuários terá suas perguntas respondidas pelas consultas
iniciais da camada 1. Se algum usuário não se satisfizer com o nível de detalhe das
respostas da camada 1, pode buscar maiores informações na camada 2 e até mesmo na
camada 3. Concluímos então que poucos usuários farão acessos regulares à última
camada, sendo que alguns nunca o farão além do nível inicial.
49
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
50
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
51
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
O SQL foi revisto em 1992 e a esta versão foi dado o nome de SQL-92. Foi revisto
novamente em 1999 e 2003 para se tornar SQL:1999 (SQL3) e SQL:2003,
respectivamente. O SQL:1999 usa expressões regulares de emparelhamento, queries
recursivas e gatilhos (triggers). Também foi feita uma adição controversa de tipos não-
escalados e algumas características de orientação a objeto. O SQL:2003 introduz
características relacionadas ao XML, sequências padronizadas e colunas com valores de
auto-generalização (inclusive colunas-identidade).
Tal como dito anteriormente, o SQL, embora padronizado pela ANSI e ISO, possui
muitas variações e extensões produzidos pelos diferentes fabricantes de sistemas
gerenciadores de bases de dados. Tipicamente a linguagem pode ser migrada de
plataforma para plataforma sem mudanças estruturais principais.
Outra aproximação é permitir para código de idioma processual ser embutido e
interagir com o banco de dados. Por exemplo, o Oracle e outros incluem Java na base de
dados, enquanto o PostgreSQL permite que funções sejam escritas em Perl, Tcl, ou C,
entre outras linguagens.
Ä Palavras-chaves em SQL
o SELECT
o INSERT
É usada para somar uma fila (formalmente uma tupla) a uma tabela existente.
o UPDATE
o DELETE
Pode ser usado para marcar o começo de uma transação de banco de dados que pode
ser completada ou não.
52
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
o COMMIT
o ROLLBACK
Faz com que as mudanças nos dados existentes desde que o último COMMIT ou
ROLLBACK sejam descartadas.
o COMMIT e ROLLBACK
o CREATE cria um objeto (uma Tabela, por exemplo) dentro do base de dados.
Embora tenha apenas um comando a DQL é a parte da SQL mais utilizada. O comando
SELECT é composta de várias cláusulas e opções, possibilitando elaborar consultas das
mais simples as mais elaboradas.
53
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
Ä Índices
Todos os tipos de bancos de dados podem ter seu desempenho melhorado pelo uso
de índices. O tipo mais comum de índice é uma lista ordenada dos valores de uma
coluna de uma tabela, contendo ponteiros para as linhas associadas a cada valor. Um
índice permite que o conjunto das linhas de uma tabela que satisfazem determinado
critério sejam localizadas rapidamente. Há vários métodos de indexação utilizados
comumente, como árvores B, hashes e listas encadeadas.
Ä Gatilho
54
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
CONCLUSÃO
55
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
BIBLIOGRAFIA
www.wikipedia.org
www.apostilando.com
www.maxarte.com.br/eduardocustodiohp/DataWareHouse.htm
Apostilas;
Material da Profª Luana Vachelli.
56
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.