Aula11-Data Understanding Preparation Novo Exemplo
Aula11-Data Understanding Preparation Novo Exemplo
Aula11-Data Understanding Preparation Novo Exemplo
10
Exemplos de Preparação de dados
usado a plataforma Orange
Conteúdos adaptados dos materiais de
Ana Maria Almeida, Fernando Batista e Anabela Costa
Tratamento de dados
Data understanding + Data Prepatation
Tratamento de dados
Dataset: Yelp_reviews_2015_2017
• Os dados são originários de um dataset disponibilizado pelo site Yelp e dizem
respeito a uma amostra, composta por 21159 observações, relativas a
comentários/ reviews e ratings de estabelecimentos classificados no site Yelp
(por exemplo, restaurantes, bares, centros de cabeleireiro e estética, lojas de
decoração/ mobílias, empresas distribuidoras de combustível, imobiliárias
• Média: 3,66;
• O coeficiente de dispersão: 𝐶𝑉=0,39;
• Rating com maior frequência (moda) é
5 e o rating com menor frequência é 2
(ver gráfico de barras).
Tratamento de dados - Normalização
Conclusão: