Big Data para Executivos e Profissionais de Mercado - Terceira Edição: Big Data
()
Sobre este e-book
Big Data é uma tecnologia "Moonshot", daquelas que surgem e alteram profundamente a vida das pessoas e suas carreiras profissionais.
Este eBook está organizado para fornecer uma visão geral sobre Big Data, Data Science e Análise de Dados, estruturando o conhecimento de maneira informativa, menos técnica, para um melhor entendimento e rápido aprendizado, desmistificando e orientando Executivos e Profissionais de Mercado sobre como utilizar Big Data em seu favor visando obter maior sucesso profissional.
Este eBook é um primeiro passo para você conhecer e se interessar por Big Data.
Avalie o resumo de aprendizado que fará nesta jornada.
I - Introdução ao Big Data e Ciência de Dados. Principais Tecnologias aplicadas ao Big Data. Tecnologias de nuvem, sistemas, hardware e software.
II - Ecossistema Hadoop e a sua importância para Big Data. O paradigma da programação em paralelo MapReduce para resolver problemas em Big Data. Data Lake, Data Warehouse e os processos de ETL para Big Data.
III - A Ciência de Analytics e suas derivações para Predictive e Big Data. As ferramentas de Analytics e suas aplicações em Big Data. Machine Learning (ML) ou Aprendizado de Máquina e a sua relação com Big Data. Aplicações de ML para Big Data. Introdução à Visualização de Dados.
IV - Principais carreiras profissionais em Big Data. Empresas que criaram Big Data e utilizam a tecnologia. Aplicações de Big Data nas empresas brasileiras. Aplicações de Big Data para redes sociais e Internet das coisas. Privacidade e Governança em Big Data.
V - Influenciadores de Big Data e Data Science. Como se tornar um Data Scientist. Orientações Curriculares e Acadêmicas.
VI - Conclusões gerais sobre a Era de Big e suas implicações na vida empresarial e profissional.
Novidades desta Terceira Edição
Além do reposicionamento de conteúdo e das revisões dos textos para facilitar a leitura, foi incluída uma Seção de Revisão Rápida de Aprendizagem em cada um dos Capítulos, abordando os principais pontos.
É possível ler todo o livro, e depois reler as Revisões Rápidas. Ou, retomar a leitura do livro, em trechos específicos, relendo a Revisão Rápida para tirar as dúvidas dos conteúdos.
Pode-se também voltar ao livro alguns meses depois, e ler apenas as Revisões Rápidas, com ganho de tempo para revisão dos conteúdos.
Jose Antonio Ribeiro Neto
Hello! Welcome. My name is Jose Antonio. I am a Portuguese and Brazilian citizen, Author, living period in each of these countries. I am a Researcher of Big Data, Data Science, and ML. For ten years, I was a USA WebCT/Bb IT Account Executive (Brazilian partnership). My wife is a teacher, my daughter, a Journalist, and my son, an Economist. I love sports and travel to enjoy the countries around the world. I desire that everyone lives in peace on this planet. My activities in Big Data include: - Research in Big Data, Data Science, Analytics, and ML fields - UCSD Coursera Big Data Mentor - Author and Mentor UCAM RJ Big Data Courses - Author "Big Data for Executives and Market Professionals" - Open edX platform eLearning Big Data Author - LinkedIn writer and advisor for Big Data career My Professional Experience includes: - Researcher in Big Data Analytics - Director of Education and Technology - USA WebCT/Bb IT Account Executive - MCSE (Microsoft Systems Engineer) - IT Account Executive for Microsoft SaaS - Author. IT Professor. IT Technical Writer. LinkedIn: https://www.linkedin.com/in/joseantonio11 ePortfolio: https://joseantonio.xnewdata.com/publish e-mail: [email protected]
Leia mais títulos de Jose Antonio Ribeiro Neto
Futebol que vem de Deus - A arte de jogar Futebol e encantar pessoas Nota: 0 de 5 estrelas0 notasComo dizia meu Avô Português - Orientações para Reinventar-se na vida pessoal e profissional" Nota: 0 de 5 estrelas0 notas
Relacionado a Big Data para Executivos e Profissionais de Mercado - Terceira Edição
Títulos nesta série (3)
Big Data para Ejecutivos y Profesionales: Big Data, #1 Nota: 0 de 5 estrelas0 notasBig Data para Executivos e Profissionais de Mercado - Terceira Edição: Big Data Nota: 0 de 5 estrelas0 notasBig Data for Executives and Market Professionals - Third Edition: Big Data Nota: 0 de 5 estrelas0 notas
Ebooks relacionados
Big Data: Técnicas e tecnologias para extração de valor dos dados Nota: 4 de 5 estrelas4/5Big Data Nota: 5 de 5 estrelas5/5A Tomada De Decisão Em Tempos De Big Data Nota: 0 de 5 estrelas0 notasGestão e Governança de Dados: Promovendo dados como ativo de valor nas empresas Nota: 0 de 5 estrelas0 notasConceitos Gerais De Business Intelligence Nota: 0 de 5 estrelas0 notasGestão Na Tecnologia Da Informação Nota: 0 de 5 estrelas0 notasBusiness Intelligence: Implementar do jeito certo e a custo zero Nota: 4 de 5 estrelas4/5Aprendizado De Máquina Em Ação: Um Manual Para Leigos, Guia Para Iniciantes Nota: 0 de 5 estrelas0 notasInteligência Artificial como serviço: Uma introdução aos Serviços Cognitivos da Microsoft Azure Nota: 3 de 5 estrelas3/5Introdução à Inteligência Artificial Nota: 0 de 5 estrelas0 notasBusiness Intelligence Nota: 0 de 5 estrelas0 notasData Visualization: Transforme dados em conhecimento Nota: 0 de 5 estrelas0 notasIntrodução a Data Science: Algoritmos de Machine Learning e métodos de análise Nota: 0 de 5 estrelas0 notasMétricas Ágeis: Obtenha melhores resultados em sua equipe Nota: 0 de 5 estrelas0 notasInteligência artificial: Processos de aprendizado de máquina, aprendizado profundo e automação Nota: 0 de 5 estrelas0 notasBíblia De Programação Python Para Iniciantes Nota: 0 de 5 estrelas0 notasModelagem de Processos com BPMN Nota: 0 de 5 estrelas0 notasImplantando a Governança de TI (4ª edição): da Estratégia à Gestão de Processos e Serviços Nota: 5 de 5 estrelas5/5Computação em Nuvem Nota: 5 de 5 estrelas5/5Inteligência artificial: Como aprendizado de máquina, robótica e automação moldaram nossa sociedade Nota: 0 de 5 estrelas0 notasMySQL: Comece com o principal banco de dados open source do mercado Nota: 4 de 5 estrelas4/5Inteligência artificial: O guia completo para iniciantes sobre o futuro da IA Nota: 5 de 5 estrelas5/5IoT: Como Usar a "Internet Das Coisas" Para Alavancar Seus Negócios Nota: 4 de 5 estrelas4/5Sistemas de Informação: gestão e tecnologia na era digital Nota: 0 de 5 estrelas0 notasPandas Python: Data Wrangling para Ciência de Dados Nota: 0 de 5 estrelas0 notasInteligência artificial: Análise de dados e inovação para iniciantes Nota: 0 de 5 estrelas0 notasArquitetura Orientada a Eventos: Soluções escaláveis e em tempo real com EDA Nota: 0 de 5 estrelas0 notasAnálise De Sistemas - Vol 1 Nota: 0 de 5 estrelas0 notasLei Geral de Proteção de Dados nas Organizações Nota: 3 de 5 estrelas3/5Implantando a Governança de TI - Da estratégia à gestão dos processos e serviços (3ª edição) Nota: 0 de 5 estrelas0 notas
Métodos e Materiais de Ensino para você
Como Convencer Alguém Em 90 Segundos Nota: 3 de 5 estrelas3/5Sexo Sem Limites - O Prazer Da Arte Sexual Nota: 4 de 5 estrelas4/5Ensine a criança a pensar: e pratique ações positivas com ela! Nota: 4 de 5 estrelas4/5Raciocínio lógico e matemática para concursos: Manual completo Nota: 5 de 5 estrelas5/5Aprender Inglês - Textos Paralelos - Histórias Simples (Inglês - Português) Blíngüe Nota: 4 de 5 estrelas4/5Pedagogia do oprimido Nota: 4 de 5 estrelas4/5Temperamentos Nota: 5 de 5 estrelas5/5Massagem Erótica Nota: 4 de 5 estrelas4/5Pense Como Um Gênio: Os Sete Passos Para Encontrar Soluções Brilhantes Para Problemas Comuns Nota: 4 de 5 estrelas4/5BLOQUEIOS & VÍCIOS EMOCIONAIS: COMO VENCÊ-LOS? Nota: 4 de 5 estrelas4/54000 Palavras Mais Usadas Em Inglês Com Tradução E Pronúncia Nota: 5 de 5 estrelas5/5A Bíblia e a Gestão de Pessoas: Trabalhando Mentes e Corações Nota: 5 de 5 estrelas5/5Consciência fonológica na educação infantil e no ciclo de alfabetização Nota: 5 de 5 estrelas5/5Nada Pode Me Ferir - David Goggins Nota: 5 de 5 estrelas5/5Jogos e Brincadeiras para o Desenvolvimento Infantil Nota: 4 de 5 estrelas4/5Por que gritamos Nota: 5 de 5 estrelas5/5Teorias E Técnicas Da Tcc Nota: 5 de 5 estrelas5/5Como Passar Em Concurso Público, Em 60 Dias, Sendo Um Fudido Na Vida Nota: 5 de 5 estrelas5/5Piaget, Vigotski, Wallon: Teorias psicogenéticas em discussão Nota: 4 de 5 estrelas4/5Gramática Escolar Da Língua Portuguesa Nota: 5 de 5 estrelas5/5Minuteens: Um devocional pra adolescentes Nota: 5 de 5 estrelas5/5Yorùbá Básico Nota: 5 de 5 estrelas5/5O herói e o fora da lei: Como construir marcas extraordinárias usando o poder dos arquétipos Nota: 4 de 5 estrelas4/5Meu Maior Desafio Da Vida - Tdah Nota: 0 de 5 estrelas0 notas
Avaliações de Big Data para Executivos e Profissionais de Mercado - Terceira Edição
0 avaliação0 avaliação
Pré-visualização do livro
Big Data para Executivos e Profissionais de Mercado - Terceira Edição - Jose Antonio Ribeiro Neto
Dedicação
O tempo é o maior inimigo da criatividade.
Quase tudo o que fazemos na vida acaba se tornando mais demorado, mais longo, extenso e profundo, do que o imaginado na concepção.
Os detalhes finais do que está sendo escrito, quem sabe, o momento mais prazeroso da autoria, garantem que a missão está chegando ao fim, e ao mesmo tempo lembram que ainda poderia ser melhorado, promessa para as próximas versões.
Dedico este livro à minha família, que incentivaram a sua produção. Selma (esposa), Germano e Belle (filhos), Camila (nora) e Guilherme (genro). Aos amigos Valter, Cassiano, Cláudio Minetto, Salles e Zechin eternos companheiros da Educação. Minha amiga e conselheira Maria Inês Fini. Aos amigos do trabalho, Fabiana, Eveline e Vilma, pela amizade. Aos amigos revolucionários Vanderlei e Daniel.
Aos amigos Americanos Norm Olsen, John Copher, Brad Beecher. Ao Paulo Granja, meu grande amigo de Portugal. Aos amigos Fernando e Beluce da Universidade Cândido Mendes. Ao amigo irmão Roberto Rocha. Minhas irmãs Fátima, Lúcia e suas famílias, meu pai (já falecido) e à minha mãe, razão de nossas vidas.
Agradeço a Deus, nosso criador, que nos oferece a dádiva da vida, e nos concede o tempo e o dom de aprender.
Jose Antonio Ribeiro Neto
Prefácio
Bem-vindo livro Big Data para Executivos e Profissionais de Mercado – Terceira Edição
.
Elaborado para profissionais que queiram obter informações sobre esta nova área que está revolucionando as empresas, seus produtos e serviços, alterando mercados e as carreiras profissionais.
O conhecimento foi estruturado de maneira informativa, menos técnica, para rápido aprendizado. Foram citadas diversas Curiosidades
sobre cada um dos temas, que chamam a atenção, aprofundam e ampliam a sua visão.
Big Data é uma tecnologia Moonshot
, daquelas que surgem e alteram profundamente a vida das pessoas e suas carreiras profissionais.
Empresas e profissões se tornam cada dia mais data-driven
(orientadas para dados). Uma nova cultura de dados será exigida dos profissionais, que devem incorporar a Análise de Dados como uma de suas habilidades profissionais.
Nosso objetivo é fornecer uma visão geral sobre Big Data, Ciência de Dados, Analytics e Machine learning, conceitos, tecnologias, aplicações, estudos de caso, análise de dados, insights sobre dados e ações empresariais práticas.
Que a leitura deste livro possa despertar o interesse sobre Big Data e sirva de orientação para o seu crescimento pessoal e profissional.
O que vamos aprender?
Uma longa caminhada começa pelo primeiro passo
Lao Tsé.
Este livro é um primeiro passo para você conhecer e se interessar por Big Data.
Avalie o resumo de aprendizado que fará nesta jornada.
1 - Introdução ao Big Data e Ciência de Dados. Como dimensionar os Dados. Classificação dos Dados. Os V’s do Big Data. Introdução à Ciência de Dados. Cientista de Dados e Big Data. Principais Tecnologias aplicadas ao Big Data. Tecnologias de nuvem, sistemas, hardware e software.
2 - Ecossistema Hadoop e a sua importância para Big Data. O paradigma da programação em paralelo MapReduce para resolver problemas em Big Data. Data Lake, Data Warehouse e os processos de ETL para Big Data.
3 - Análise de Dados em Big Data. A Ciência de Analytics e suas derivações para Predictive e Big Data Analytics. As ferramentas de Analytics e suas aplicações em Big Data. Modelo Gartner para a Análise de Dados.
4 - Machine Learning (ML) ou Aprendizado de Máquina e a sua relação com Big Data. Aplicações de ML para Big Data. Algoritmos utilizados em ML. Plataformas de desenvolvimento de ML. Introdução à Visualização de Dados. Principais ferramentas de Visualização de Dados.
5 - Principais carreiras profissionais em Big Data. Empresas que criaram Big Data e utilizam a tecnologia. Aplicações de Big Data nas empresas Brasileiras. Aplicações de Big Data para redes sociais e IoT.
6 - Privacidade e Governança em Big Data. Influenciadores de Big Data e Data Science. Como se tornar um Data Scientist. Orientações Acadêmicas. Orientações Curriculares.
7 - Big Data para Executivos. Big Data para Profissionais de Mercado. Conclusões gerais sobre a Era de Big Data e suas implicações na vida empresarial e profissional.
O que é novo na terceira edição?
Além do reposicionamento de conteúdo e revisões dos textos para facilitar a leitura, foi incluída uma Seção de Revisão de Aprendizagem em cada um dos Capítulos, abordando os principais pontos.
É possível ler todo o livro, e depois reler as Revisões Rápidas. Ou, retomar a leitura do livro, em trechos específicos, relendo a Revisão para tirar as dúvidas dos conteúdos.
Pode-se também voltar ao livro alguns meses depois, e reler apenas as Revisões, com ganho de tempo para rever os conteúdos.
Com o implemento destas Revisões, o livro, ganhou um maior número de páginas, mas simplificou o processo de aprendizado sobre os conteúdos fornecidos.
Capítulo 1. Introdução ao Big Data
Big Data atrai a curiosidade.
Representa dados em grandes quantidades, em uma dimensão não imaginada alguns anos atrás, e que um dia poderiam vir a ser armazenados e processados por computadores a um baixo custo.
O termo surgiu para se referir às aplicações de computadores que utilizam grandes volumes de dados em diferentes formatos, que podem ser agrupados, lidos, convertidos, analisados com técnicas estatísticas, matemáticas e computacionais, gerando um novo tipo de conhecimento chamado de Data Insight
, algo conclusivo e ainda nunca pensado sobre os dados originais.
A geração de insights a partir dos dados, pode resultar tanto na decisão de uma mudança brusca na orientação de um negócio, quanto na criação de um novo produto, chamado de Data-Driven Product
(Produto Orientado a Dados) que podem revolucionar a empresa e os seus negócios.
As empresas mundiais que se valem desta tecnologia, são conhecidas como Data-Driven Companies
. As que ajudaram a fundar esta nova área, se diferenciaram e valem bilhões de dólares. Para citar algumas, temos a Google, Yahoo, Uber, Tesla, NetFlix, Amazon, LinkedIn, Facebook entre outras.
Muitas empresas estão buscando se adaptar ao novo mundo do Big Data, da Análise de Dados e das decisões orientadas pelos insights sobre os dados. Para algumas, a sobrevivência depende deste conhecimento.
De onde surgem tantos dados? Como são gerados? Como podem ser aproveitados? Quais profissionais trabalham em Big Data? Quais são as principais tecnologias? Quais são os tipos de aplicações para Big Data? Como elas afetam as empresas e os indivíduos?
Enfim, estas e outras questões serão respondidas neste livro.
Seção 1 - Fontes de Geração de Dados
Os dados gerados para Big Data provêm de três fontes: Pessoas, Máquinas, Empresas.
1 - Pessoas
Geram dados a partir de Redes Sociais (Facebook, Twitter, Instagram, LinkedIn), e-mails, uso de Internet, geração de documentos, publicação de blogs, etc.
2 - Máquinas
Geram dados a partir de sensores, satélites, arquivos de logs, câmeras, máquinas de sequenciamento genético, telescópios espaciais, sondas, etc.
3 - Empresas
Geram dados a partir de transações comerciais, cartões de crédito, sistemas de controles administrativos e financeiros, comércio eletrônico, registros médicos, vendas de produtos, pesquisa de novas tecnologias, etc.
Figura 1- Geração de Dados (créditos pixabay)
Curiosidades
Geramos diariamente 2,5 quintilhões de bytes de dados.
Mais de 90% de todos os dados gerados no mundo foram criados nos últimos dois anos.
Estima-se que a cada um minuto enviamos 204 milhões de e-mails, tuitamos 456 mil vezes, geramos 1,8 milhões de Likes e postamos 200 mil fotos no Facebook.
A cada minuto são carregadas mais de 100 horas de vídeo no YouTube.
Se você gravar em DVDs todos os dados gerados no mundo relativos a um dia, eles seriam empilhados duas vezes cobrindo a distância daqui até a Lua.
Estima-se que mais de vinte mil novos sites são criados por dia na Internet.
Seção 2 – Dados são o novo Petróleo
A frase Data is the new oil
surgiu em 2006 e desde então vem sendo utilizada com frequência em publicações importantes, citadas por CEOs e líderes mundiais da Fortune 500, para se referir à importância do dado e da informação nesta era do Big Data.
Trata-se de uma Analogia, pois da mesma forma que há um século atrás, as empresas que conseguiram explorar Petróleo, acumularam vasta riqueza, estabeleceram monopólios e construíram a base da economia, hoje, as empresas data-driven
como a Google, Facebook, Uber, Amazon, Yahoo, entre outras estariam fazendo o mesmo com a nossa economia.
Figura 2 - Data os the new oil (créditos pixabay)
Vivemos em uma economia digital, onde os dados são muito valiosos. É a chave para a boa funcionalidade do mundo, desde governos até empresa. Sem eles o progresso do mundo seria interrompido.
Dados são o combustível que direciona a economia, e provavelmente estamos passando a viver na chamada Data Economy
(Economia de Dados).
Curiosidades
Os dados estão definindo o crescimento da economia, remodelando as empresas, a política e a economia. Como o Petróleo, os dados são extraídos, refinados, avaliados, comprados e vendidos. Será que as batalhas no futuro serão travadas e vencidas por quem administrar melhor os dados?
Para Clive Humby, Matemático Inglês e arquiteto do Tesco's Clubcard, é creditada criação da frase: Data is the new oil
(2006).
Virginia Rometty, CEO da IBM citou em Discurso no Conselho de Relações Exteriores em 2013: Quero que você pense em dados como o próximo recurso natural
.
Meglena Kuneva, Comissária Europeia do Consumidor, 2009: Os dados pessoais são o novo óleo da Internet e a nova moeda do mundo digital
.
Seção 3 – Dark Data (Dados Escuros)
Estima-se que para 2030 mais de 90% dos dados serão não estruturados e esta explosão de dados, vai superar a capacidade humana em utilizá-los.
Dark Data ou Dados Escuros, são dados adquiridos através de várias operações pelas empresas e não utilizados para fins de análise. Pode-se decidir manter estes dados para uso futuro, com custos adicionais de armazenamento ou descartá-los por considerá-los sem utilidade.
O acelerador de partículas atômicas (Large Hadron Collider) da Organização Europeia para a Pesquisa Nuclear, é o maior do mundo, gerando 25GB de dados por segundo. A maior parte destes dados tem de ser descartada pois o volume é tão grande que invalidaria seu armazenamento e tempo hábil para análise.
A picture containing fence Description automatically generatedfigura - Dark Data (direitos pixabay)
Quando se tem geração de dados em alta velocidade, e não é possível armazena-los totalmente, são utilizadas técnicas de amostragem, colhendo apenas uma fração dos dados mais representativos que não comprometem a análise.
Curiosidades
O nome Dark Data
foi escolhido como uma analogia a Dark Matter
ou Matéria Escura, utilizada na área de Física para descrever uma energia que não se consegue observar, mas que está lá e cobre 80% do universo.
O termo Dark Data
foi cunhado pela Consultoria Gartner.
De acordo com pesquisa da IDC, o volume de dados no mundo dobra a cada 2 anos. Devemos gerar 44 ZetaBytes, equivalentes a 44 trilhões de GigaBytes, até 2020.
Deep Web é um termo para se referir à dados na Web que não são acessados e indexados pela Google, e, portanto não estão publicamente acessíveis. Acredita-se que sejam 500 vezes maior do que toda a Internet. Eles são Dark Data.
Dados não estruturados acabam se tornando Dark Data, pelo fato de muitas empresas ainda não contarem com conhecimento e tecnologia para capturá-los e realizar a sua análise.
Seção 4 – Máquinas geram mais Dados
Big Data se tornou viável combinando grandes volumes de dados, associados ao baixo custo das tecnologias de hardware, software e computação de nuvem, e a necessidade das empresas gerarem novos conhecimentos, ou insights
para garantirem a sobrevivência
A picture containing floor, indoor, table Description automatically generated .
figura - Máquinas gerando dados (créditos pixabay)
Mas, quem gera mais dados? Empresas, Pessoas ou Máquinas? Máquinas geram mais dados.
Geram 100 vezes mais dados que as empresas e 10 vezes mais dados que as pessoas.
Resumindo:
Empresas = geram 1X
Pessoas = geram 10X
Máquinas = geram 100X
Alguns exemplos de dados gerados por máquina são: sensores de todos os tipos embutidos em equipamentos, sensores em máquinas em geral, clusters de computadores, logs gerados dispositivos (computadores, smartphones, celulares, nós de redes, roteadores), telemetria por satélites, chips RFID, Sistemas de GPS, software que geram cálculos automáticos, sistemas de aprendizado de máquina, sistemas de automação, Internet das Coisas (IoT), entre outros.
Curiosidades
Dados de Máquinas são dados gerados sem o envolvimento humano, coletados automaticamente.
A empresa Splunk é especializada em coletar e analisar dados de máquinas.
Dados gerados por máquinas são atividades digitais realizadas por computadores, telefones, smartphones, sistemas embarcados e outros dispositivos em rede.
As empresas estão começando a descobrir a importância dos dados gerados por máquinas tais como imagens de satélites com dados meteorológicos, dados científicos como imagens sísmicas, física de alta energia, fotografias, vídeos provenientes de segurança, vigilância, dados de radares ou sonares incluindo perfis sísmicos veiculares, meteorológicos e oceanográficos.
Os veículos ou carros autônomos, são um novo exemplo, de grandes geradores de dados realizados por máquinas.
Seção 5 – Revisão
Neste Capítulo Introdução ao Big Data
aprendemos que:
Big Data representa dados em grandes volumes, que podem ser analisados a baixo custo utilizando métodos Estatísticos, Matemáticos e Computacionais.
Data Insight é o objetivo final a ser gerado a partir de uma aplicação de Big Data.
Insights identificam padrões escondidos nos dados, utilizados para o desenvolvimentos de novos produtos chamados de data oriented products
ou produtos de dados
Empresas Data-driven (orientadas para dados) utilizam estas novas tecnologias de dados para desenvolverem e ampliarem os seus negócios.
Google, Amazon, Netflix, LinkedIn, Facebook, Tesla, Uber são empresas data-driven. Consideradas as mais valiosas do mundo.
Dados são gerados por Pessoas, Máquinas e Empresas. Máquinas geram mais dados que Pessoas e Empresas.
Dados são o novo Petróleo, é uma frase utilizada por CEOs para justificar uma nova Economia baseada em Dados e a importância de Big Data nos negócios.
Dark Data ou Dados Escuros são dados gerados e não utilizados pelas empresas, descartados por falta de uso. As empresas utilizando Big Data estão descobrindo a sua importância para a geração de novos negócios e aumento de faturamento.
Capítulo 2. Como Dimensionar os Dados
Se você tem um celular ou computador, deve ter noção da capacidade de armazenamento.
Um celular tem 16, 32, 64GB ou mais, para armazenamento. Um computador 4, 8 ou 16 GB de memória RAM e discos de 250, 500 GB, ou 1TB.
Se o seu celular tem 64GB de espaço, equivale a dizer que podem ser armazenados 64 x 1.073.741.824 Bytes ou Caracteres.
Medidas de dados são escalonadas utilizando como base numérica o sistema binário (base 2) dos computadores. Assim, 2ˆ10 (dois elevados à potência 10) equivale a 1.024 Bytes.
Vamos conhecer estas medidas, para adquirir uma noção do volume de dados gerados em Big Data.
Unidades de Medidas de Dados e Valores.
1 Byte = 1 Caractere ou 8 bits
1 kilobyte (KB) = 1024 bytes
1 MegaByte (MB) = 1024 KiloBytes
1 GigaByte (GB) = 1024 MegaBytes
1 TeraByte (TB) = 1024 GigaBytes
1 PetaByte (PB) = 1024 TeraBytes
1 ExaByte (EB) = 1024 PetaBytes
1 ZettaByte (ZB) = 1024 ExaBytes
1 YottaByte (YB) = 1024 ZetaBytes
Você utiliza medidas diariamente, como quilos para peso, metros ou quilômetros para distância, e ao longo do tempo vai se adaptar naturalmente à estas medidas de dados.
Medir dados é sempre um processo assustador, pois vamos perceber que o volume aumenta exponencialmente e nossos dispositivos não estão preparados para todo este armazenamento, sendo necessário recorrer para as tecnologias de nuvem que fornecem armazenamento quase ilimitado ao que precisamos.