Probablidade e Estatística Univesp

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 26

Ciência de Dados - Univesp

Probabilidade
&
Estatística

PROBABILIDADE E ESTATÍSTICA !1
PROBABILIDADE E ESTATÍSTICA !2
Aluno: Iago Morandi de Souza
Professor: André Leme Fleury
26 de Abril a 16 de Junho de 2021

Probabilidade e Estatística
Semana 1

Definição Clássica de Probabilidade

Probabilidade é a chance de um evento acontecer, sendo assim para sabermos a


probabilidade de um evento acontecer devemos calcular o número de ocorrências dividido
pelo número total de eventos.

P = M/N

Sendo P = Probabilidade M = chance de sucessos N = Número de possibilidades

Exemplo, lançar um Dado de 6 faces e obter a número 1

P = 1/6 -> P = 0,17 -> P = 17%

______________________________________________________________________

Probabilidade Entre Eventos

Quando Ocorre mais de um evento ao mesmo tempo, existe a possibilidade de eles


ocorrerem algumas interações, sendo assim podemos ter

A∩B -> A interceção B é a chance de ambos os eventos acontecerem ao mesmo tempo


AUB -> A União B é a chance de ocorrer um evento, ou o outro, ou ambos

PROBABILIDADE E ESTATÍSTICA !3
Para calcular AUB não podemos simplesmente somar A+B pois estaríamos contando
duas vezes quando o evento está em A∩B, sendo assim, AUB = A + B - A∩B.

A mesma lógica se aplica quando temos 3 eventos

Ao simplesmente somar os três iriamos estar contando várias vezes o mesmo evento,
então precisamos retirar o que foi somado 2 vezes da conta:

A + B + C - A∩B - A∩C - B∩C + A∩B∩C

Note que somamos no Final A∩B∩C (a interceção entre os 3 eventos), isto ocorre pois
ao reduzir as interseções de A∩B - A∩C - B∩C acabamos por retirar mais do que deveria,
então é preciso "devolver" o que foi tirado em excesso.

______________________________________________________________________

PROBABILIDADE E ESTATÍSTICA !4
Teoria da Contagem

Ao combinar 2 eventos o número de possibilidades é a multiplicação das possibilidades


de cada evento em separado.
EX:
Se temos um dado com 6 faces, temos 6 possibilidades, e se temos uma moeda com cara
e coroa temos 2 possibilidades, ao combinar ambos os eventos teremos 12 possibilidades.

Cara 1 2 3 4 5 6

Coroa 1 2 3 4 5 6

A Tabela acima representa a combinação das possibilidades de jogada de dado e de


jogar uma moeda, para cada cara existem 6 combinações possíveis com dados, e para cada
coroa existem mais 6 combinações possíveis, se a moeda tivesse mais de duas faces teriam
mais 6 combinações por face pois o dado contém 6 faces, da mesma forma, se fosse um dado
de 12 faces teriam 24 possibilidades, sendo 12 com coroa e 12 com cara.

______________________________________________________________________

Combinações

Quando precisamos escolher combinações dentro de um grupo limitado, podemos


utilizar a fórmula:

Em que N = total de elementos do conjunto amostral P = número de elementos


escolhidos e C = O total de combinações possíveis.

PROBABILIDADE E ESTATÍSTICA !5
EX:
Para saber a quantidade de possibilidades para formar uma comissão de 3 pessoas em
um grupo de 10 pessoas.
C = N!/(P!(n-p)!) --> C = 10!/(3!(10-3)!)
C = 10!/3!7! --> C= 10.9.8/3.2.1
C= 720/6 --> C = 120

Ao interpretar devemos ter em conta que são 120 possibilidades de grupos diferentes
selecionando 3 pessoas em um grupo de 10 pessoas.

______________________________________________________________________

Arranjos

Quando a ordem faz diferença na seleção ao invés de utilizar uma combinação,


utilizamos arranjos, nesse tipo de caso é o mesmo que dizer que João e Maria é diferente de
Maria e João já que a ordem passou a fazer diferença.

Em que N = total de elementos do conjunto amostral P = número de elementos


escolhidos e A = o número de arranjos possíveis.
EX:
Para saber a quantidade de possibilidades para formar uma comissão de 3 pessoas em
um grupo de 10 pessoas, porém desta vez, o primeiro sorteado vai receber o cargo de CEO, o
segundo o cargo de CFO e o terceiro o cargo de Miss Simpatia, desta forma a ordem da
seleção faça diferença no resultado final.

A = N!/(N-P)! --> A = 10!/(10-3)!


A = 10!/7! --> A = 10.9.8/1
A = 720

PROBABILIDADE E ESTATÍSTICA !6
Devemos interpretar a resposta como existem 720 tipos de arranjo diferentes para
selecionar 3 pessoas de um grupo de 10.

Semana 2

Eventos Independentes

Quando Existem 2 eventos independentes (que não se relacionam) e é necessário


descobrir a chance de ambos acontecerem simultaneamente, basta multiplicar as 2
probabilidades. EX:
Suponhamos que tem 10% de chance de chover em determinado dia e que tenha 5%
de chance de você esquecer as chaves do seu armário, há o interesse em saber qual a chance
de esquecer as chaves do armário e chover no mesmo dia.

10% x 5% --> 0,1*0,05 = 0,05 --> 0,5%

Desta forma temos que há 0,5% ou 1/200 chances de esquecer as chaves do armário e
chover no mesmo dia.

Exercício resolvido

Uma Central de Atendentes possui 6 atendentes e cada um possui 60% de chances de


estar ocupado, qual função descreve a probabilidade de estarem em atendimento?
para resolver é primeiro pensar que existem 7 probabilidades de estarem disponíveis,
sendo 0, 1, 2, 3, 4, 5, 6.
Para a probabilidade de 0 estarem disponíveis, temos a chance de não estar atendendo
que é de 0,4 elevado a sexta potência já que são 6 atendentes, como vimos na teoria dos
eventos independentes.
0,4^6 = 0,0041
para a possibilidade de termos 1 atendente estar atendendo, teremos 5 que estarão
ocupados, sendo assim teremos.
0,4^ 5 x 0,6 x 6 = 0,0369

PROBABILIDADE E ESTATÍSTICA !7
Note que neste temos o número 6 multiplicando, esse número 6 reflete o número de
possibilidades visto que são 6 atendentes diferentes e qual deles está atendendo faz diferença,
ou seja, estar atendendo o atendente 1, 2, 3, 4, 5 ou 6 faz diferença.

Quantidade em Método de Cálculo Probabilidade de


Atendimento ocorrência

0 0,4^6 0,0041
1 0,4^5 x 0,6 x 6 0,0369
2 0,4^4 x 0,6^2 x 15 0,1382
3 0,4^3 x 0,6^3 x 20 0,2765
4 0,4^2 x 0,6^4 x 15 0,3110
5 0,4 x 0,6^5 x 6 0,1866
6 0,6^6 0,0467

Mas ai entra a grande questão, como saber quantas possibilidades diferentes temos em
cada situação? com 6 atendentes ainda pode ser possível imaginar todas as possibilidades,
embora alguns já possam ter dificuldades, mas e com casos maiores? vai se tornando
impossível imaginar todas as opções, sendo assim uma alternativa é calcular as combinações.
olha um exemplo para calcular o número de possibilidades de termos 2 atendentes ocupados.

C = N!/(P!(n-p)!) --> C = 6!/(2!(6-2)!)


C = 6!/2!4! --> C= 6.5/2
C= 30/2 --> C = 15

Ou o número de possibilidades de termos 3 atendentes ocupados.

C = N!/(P!(n-p)!) --> C = 6!/(3!(6-3)!)


C = 6!/3!3! --> C= 6.5.4/3.2.1
C= 120/6 --> C = 20

PROBABILIDADE E ESTATÍSTICA !8
Então assim chegamos à conclusão que que para saber a probabilidade de um evento
acontecer ele obedece à expressão.

P(K) = C(N/K) x 0,6^K x 0,4^(N-K)


nota: C(N/K) é a combinação de N em K

Destrinchando essa expressão temos que N é o numero de atendentes (6), K é o


número de atendentes ocupados, 0,6 a probabilidade de estar ocupado e 0,4 a
probabilidade de não estar ocupado.

Propriedades das distribuições de Probabilidade

Média: è a medida mais básica, também conhecida como esperança matemática, pode
ser obtida somando todos os valores da amostra e dividindo pelo número de valores.
Moda: é o número que mais se repete na amostra, pode ser também amodal quando
não há moda, ou multimodal quando há mais de uma moda.
Mediana: é o valor que está no "meio" dos dados, para achar a mediana é preciso
ordenar os dados do menor para o maior (ou do maior para o menor) e no caso de a
amostra ter um número impar de objetos, o valor que estiver no meio é a mediana, caso
possua um número par, a mediana é a média entre os 2 valores do meio.
Variância: é um coeficiente de variação utilizado para saber o quando os dados estão
dispersos, por exemplo, uma amostra com os valores (1, 3, 5, 7, 9) é bem diferente de uma
amostra (1, 1, 5, 9, 9), ambas possuem média 5 e mediana 5 mas são bem diferentes. Para o
Cálculo da Variância calculamos a diferença de cada objeto da média e elevamos ao
quadrado, somamos todos e dividimos pelo tamanho do espaço amostral,
EX:
(5-1)^2 + (5-3)^2 + (5-5)^2 + (5-7)^2 + (5-9)^2
16 + 4 + 0 + 4 + 16 = 40/5 = 8

(5-1)^2 + (5-1)^2 + (5-5)^2 + (5-9)^2 + (5-9)^2


16 + 16 + 0 + 16 + 16 = 64/5 = 12,8

OBS: quando trabalhamos com uma amostra ao invés do todo utilizamos o tamanho
da amostra menos (-)1.

PROBABILIDADE E ESTATÍSTICA !9
Repare que a Variância no caso 2 é bem maior que no caso 1, o que aponta para
dados mais dispersos, porém ainda fica difícil de interpretar, visto que como elevamos os
números ao quadrado eles estão bem maiores que o normal.

Desvio Padrão: é a raiz quadrada da Variância, já que elevamos os elementos da


variância ao quadrado, nada mais justo que fazermos a raiz quadrada deles. no exemplo
anterior
√8 = 2,82
√12,8 = 3,57

Assim podemos interpretar que o conjunto de dados (1, 3, 5, 7, 9) tem desvio padrão
de 2,82 e o conjunto de dados (1, 1, 5, 9, 9) tem desvio padrão de 3,57 e que o segundo
conjunto de dados tem um desvio padrão maior e por tanto varia mais com relação à
média.
Coeficiente de Variação: é o desvio padrão dividido pela média, ele traz uma
parâmetro mais relativo para análise, ao trazer uma variação em porcentagem do desvio
padrão em relação à média, pense por exemplo em 2 exemplos que o desvio padrão pode
ser similar mas tem significado totalmente diferente, vamos supor que o desvio padrão da
durabilidade de uma caneta seja de 1 mês, sendo que a duração média é de 5 meses,
estamos falando de um coeficiente de variação de 1/5 ou 0,2 (20%), agora vamos supor que
o coeficiente de variação da duração de um pneu também é de 1 mês, porém o tempo
médio de duração são de 20 meses, um coeficiente de variação de 1/20 ou 0,05(5%), então
a variação embora seja o mesmo tempo, é muito mais relevante na caneta que no pneu,
sendo o pneu mais homogêneo e a caneta mais heterogênea.
Amplitude: Amplitude é quase que uma forma de descrever o tamanho do nosso
espaço amostral, para obter essa informação subtraimos o menor valor de uma amostra do
maior valor, no caso acima faríamos 9-1 = 8 e o conjunto de dados anterior possuí
amplitude 8.

Semana 3

Distribuição de Bernoulli

PROBABILIDADE E ESTATÍSTICA !10


A distribuição de Bernoulli é uma distribuição na qual um evento ocorre ou não,
então é sucesso ou fracasso, suponhamos que no lançamento de um dado, a chance de
sucesso ao obter o número 4 no dado é de 1/6 ou 0,17 , neste caso a chance de fracasso é
1-0,17 = 0,83.
P = p^k x p^(1-k)

Distribuição Binomial

Cada evento possui apenas 2 resultados possíveis, sendo fracasso ou sucesso

P(K) = C(N/K) x p^K x q^(N-K)

P = Probabilidade N = Espaço Amostral K = Número de Sucessos p = sucessos q =


fracassos (1-p)

Poisson

Na distribuição de Poisson eventos definidos em intervalos não sobrepostos são


independentes e a λ (lambida/média) é constante.
EX:
Número de pessoas que morrem por ano
número de pessoas por M²

Sendo λ = Média T = tempo k = número de sucessos


E = constante de Euler (2,718)

PROBABILIDADE E ESTATÍSTICA !11


Estatística descritiva

Amostra: Subconjunto da população


Amostragem: Processo de extração de amostras representativas
Riscos: Margem de erro prevista numa investigação parcial considerando o universo.
Censo: São os dados coletados de toda a população

Amostragem não Probabilística: Uma amostragem à qual não podemos estender os


dados à população por não ser aleatória, como exemplo selecionar a amostra por
conveniência ou por possuir determinada característica.
Amostragem Probabilística: Uma amostra a qual podemos estender os resultados à
população, pode ser uma amostra aleatória, aleatória estratificada, conglomerado ou
sistemática.

Semana 4

Distribuição de Frequência

ROL: Dados dispostos ordenados de forma crescente.


Frequência: número de repetições dessa observação, ou seja, quantas vezes
determinado fenômeno acontece.
Classes: Classes são os espaços de de variação de uma variável, são divisões do
espaço amostral. para calcular o número de classes de uma tiramos a raiz do número de
elementos
EX
Uma Amostra com 81 elementos o número de classes é a raiz quadrado de 81, ou
seja, 9
Para calculas a amplitude de uma classe, basta dividir a amplitude pelo numero de
classes. no caso acima, suponhamos que os dados tenha também uma amplitude de 162 (2,
4, 6, 8, 10, 12... 160, 162) cada classe teria amplitude de 18

PROBABILIDADE E ESTATÍSTICA !12


Frequência Relativa: Razão entre as frequências relativas simples e o número total
de dados.
Frequência Acumulada: a soma de frequências anteriores
EX

Autonomia por litro Número de veículos Frequência Relativa Frequência


de gasolima (Frequência) acumulada

2 km a 4,9 km 2 8% 8%

5 km a 7,9 km 3 12% 20%

8 km a 10,9 km 8 32% 52%

11 km a 13,9 km 7 28% 80%

14 km a 17 km 5 20% 100%

Moda em dados tabelados: para calcular a moda quando há dados divididos em


frequência utilizamos a fórmula:

mo = L¹ + h x d¹/(d¹+d²)

Sendo L¹ = limite inferior da classe modal d¹ = diferença entre a classe modal e a da


classe anterior e d² = diferença entre a classe modal e a classe seguinte h = amplitude entre
as classes
EX:

PROBABILIDADE E ESTATÍSTICA !13


Histogramas

Conjunto de retângulos justapostos iguais às amplitudes dos intervalos e alturas


proporcionais às frequências das classes.
EX:

Semana 5

Inferência Estatística

Inferência estatística é o processo de extrair informações sobre uma população


através dos resultados observados em uma amostra.

Intervalo de Confiança (Variância Conhecida)

Intervalo de confiança é um intervalo no qual existe certa probabilidade de de um


evento ocorrer.
Para calcular o intervalo de confiança precisamos conhecer o nível de confiança, por
exemplo, um nível de confiança de 95% quer dizer que entre o intervalo precisamos ter
95% dos resultados possíveis, ou seja, há 95% de chance de a verdadeira média estar
dentro do intervalo.

PROBABILIDADE E ESTATÍSTICA !14


Para quando sabemos a variância podemos utilizar a seguinte fórmula para
calcularmos a amplitude do intervalo de confiança:

E = Za/2 . √(a²/n)

Sendo E = semi amplitude Za = nível de confiança a² = Variância n = numero de


elementos da amostra.
Repare que na semi amplitude dividimos o nível de confiança por 2, isso acontece por
que a semi amplitude é apenas metade da amplitude, por exemplo, suponha que uma

PROBABILIDADE E ESTATÍSTICA !15


amostra tenha a média igual a 5 e que a semi amplitude seja igual a 1 com margem de
confiança de 95%, neste caso há 95% de chance da média da população estar entre 4 e 6,
pois a semi amplitude é a amplitude para cada lado, para mais e para menos.
Também é importante salientar que a Za (nível da confiança) não é o simples valor de
% e sim um valor tabelado. por exemplo, ao utilizarmos 95% devemos dividir por 2 e obter
0.95/2 = 0.475 e buscar esse valor de 0.475 na tabela Z normal. obtendo o valor de 1.96,
conforme tabela abaixo

Nesta tabela o Valor inicial é o da coluna esquerda enquanto que o valor da linha
superior é o terceiro digito. por exemplo 2,58 seria o valor que corresponde a 0,4951, que
representa uma margem de confiança total igual a 0,992 ou 99.2%

PROBABILIDADE E ESTATÍSTICA !16


Intervalo de Confiança (Proporção)

Quando calculamos o intervalo de confiança com proporção utilizamos a seguinte


formula:

E = Za/2 . √(P.(1-P)/N

Sendo E = Semi amplitude Za = nível de confiança P = Probabilidade N = n°


Elementos da amostra
Note que novamente Za é um valor tabelado na Tabela de distribuição Z normal.

Para Calcular o tamanho da amostra quando já sabemos o erro (amplitude) que


queremos utilizamos a seguinte fórmula:

N = ((Za/2)/E) . P(1-P)

Sendo N = tamanho da amostra Za = nível de confiança E = semi Amplitude (erro)


P = probabilidade

Intervalo de Confiança (Variância Desconhecida)

Quando precisamos calcular o intervalo de confiança e não sabemos a variância da


população utilizamos a tabela T student.
A forma de utilizar a Tabela T student é um pouco diferente da tabela de distribuição
normal.
A primeira diferença é a forma de procurar o valor na Tabela, utilizaremos além do
nível de confiança o número de elementos da amostra também é importante para saber os
Graus de liberdade
Grau de Liberdade: Número de elementos da amostra menos 1, se a amostra possui
21 elementos o grau de liberdade é 20.
Sendo assim, se queremos por exemplo, se queremos achar o valor na tabela T
student para 95% de nível de confiança e 10 elementos da amostra vamos la linha 9 graus
de liberdade e na coluna 5%, obtendo o valor 2,262, conforme tabela a seguir

PROBABILIDADE E ESTATÍSTICA !17


Repare que nesta tabela em específico não dividimos o valor por 2 e utilizamos o 5%
mesmo, isso é por que esta tabela em específico já foi feita para o uso desta forma, mas em
outras tabelas pode ser necessário utilizar 2,5% para achar a semi amplitude.
Para Calcular o coeficiente de variação quando a Variância da população é
desconhecida usamos a seguinte fórmula:

E = Ta/2 . √(S²/N)

E = Semi amplitude Ta = Nível de confiança S² = Variância amostral N = Número


de elementos da amostra

PROBABILIDADE E ESTATÍSTICA !18


Semana 6

Teste de Hipóteses

O teste de Hipótese consiste em 8 etapas que devem ser seguidas para testar um
hipótese

1. Determinar o Parâmetro de interesse


2. Definir a Hipótese Inicial
3. Definir a Hipótese alternativa
4. Definição da estatística do teste
5. Delimitação da região de rejeição
6. Aplicação da Estatística do teste
7. Decidir pela rejeição ou aceitação da hipótese
8. Concluir com a aceitação ou rejeição da hipótese]

Sendo Z = valor encontrado na tabela Z X = Média amostral µ = média da

população (hipótese) σ = desvio padrão N = o número de elementos da amostra

PROBABILIDADE E ESTATÍSTICA !19


Teste de Hipóteses para Proporção

Sendo Z = Valor tabelado da Tabela Z normal P = Proporção da amostra


π = Proporção da população (hipótese)

Teste de Hipóteses quando a Variância é Desconhecida

Sendo T = Valor tabelado na Tabela T Student X = Média da amostra µ = Média da


população (hipótese) S = desvio padrão N = Numero de elementos da amostra

PROBABILIDADE E ESTATÍSTICA !20


Semana 7

Correlação

É quando uma variável se relaciona com outra.


Correlação positiva: quando as 2 variáveis aumentam juntas
Correlação negativa: quando uma variável aumenta, a outra diminui

Coeficiente de correlação de Pearson

o Coeficiente de correlação de Pearson é um coeficiente que vai de -1 até 1, quando


se aproxima de -1 indica uma correlação negativa(inversa), quando é próximo de 1 indica
uma correlação positiva e quando fica próximo de 0 indica que não há correlação.

Para calcular o coeficiente de Pearson usamos a seguinte fórmula:

r = Sxy/(√Sxx . Syy)

Sendo r = coeficiente de Pearson e X e Y sendo 2 variáveis às quais se supões que há


correlação ou não.

PROBABILIDADE E ESTATÍSTICA !21


Sxy = Somatório de todos os valores de X multiplicado pelo correspondente em Y
(individualmente) menos o somatório de X multiplicado pelo somatório de Y e dividido
por N
Σxy - (Σx . Σy)/N

Sxx = Somatório de todos os valores de X elevados ao quadrado (individualmente)


menos o somatório de X elevado ao quadrado e dividido por N

Σx² - (Σx)²/N

Syy = Somatório de todos os valores de Y elevados ao quadrado (individualmente)


menos o somatório de Y elevado ao quadrado e dividido por N

Σy² - (Σy)²/N

Teste de coeficiente de Correlação

Para testar uma hipóteses de coeficiente de correlação usamos a seguinte fórmula:

T = r . √(N-2)/(1-r²)

Sendo T = valor encontrado na Tabela T student r = Coeficiente de correlação


N = número de individuas da amostra
Nota: Para calcular os graus de liberdade se usa N-2

Ao calcular o valor da Tabela T verificar se está de acordo com o valor que se espera
do nível de significância.

Regressão Linear Simples

É uma reta estimativa que pode ser transformada em uma função tal qual:
y = A +Bx

PROBABILIDADE E ESTATÍSTICA !22


Sendo X e Y posições no plano cartesiano, A e B são os valores que nos interessam.
para calcular o Valor de A:
A = Σy/n - (B . Σx)/n

sendo A = Coeficiente Linear Σy = somatória de todos os valores de y Σx =


Somatório de todos os valores de x e N = número de elementos da amostra B = Coeficiente
Angular (em resumo Σy e Σx são a média dos valores de x e y da amostra)

Nota: repare que para achar o valor do coeficiente linear precisamos do coeficiente
angular primeiro.

Para calcular o coeficiente angular utilizamos:

B = Sxy/Sxx

Sendo B = Coeficiente angular


Sxy = Somatório de todos os valores de X multiplicado pelo correspondente em Y
(individualmente) menos o somatório de X multiplicado pelo somatório de Y e dividido
por N
Σxy - (Σx . Σy)/N

Sxx = Somatório de todos os valores de X elevados ao quadrado (individualmente)


menos o somatório de X elevado ao quadrado e dividido por N

Σx² - (Σx)²/N

Variância Residual e Intervalo de confiança.

O coeficiente de variação e o coeficiente angular são estimativas, o que quer dizer


que eles também possuem intervalo de confiança e nível de confiança.

PROBABILIDADE E ESTATÍSTICA !23


Sendo assim, para calcular o Intervalo de confiança de A e B Utilizamos a seguinte
fórmula:

β = B +- T . Sb

α = A +- T . Sa

Sendo β = O intervalo da estimativa do coeficiente angular B = Coeficiente angular


T = Valor da Tabela T Student (utiliza-se N-2 para os graus de liberdade) α = O intervalo
da Estimativa do coeficiente Linear A = Coeficiente Linear
Sb = Desvio padrão de B:
√(Sr²/Sxx)

Sa = Desvio padrão de A:
√Sr² . (Σx²/n) . (1/Sxx)

Sr² = o Valor residual da amostra (variância):


(Syy - B . Sxy) / N-2

Teste de Hipótese da Reta de Regressão Linear

Caso seja necessário testar uma hipótese da reta de regressão linear é suficiente
utilizar o coeficiente de Pearson (r) para verificar se há ou não correlação.

PROBABILIDADE E ESTATÍSTICA !24


PROBABILIDADE E ESTATÍSTICA !25
The End

PROBABILIDADE E ESTATÍSTICA
Bem aventurados
!26
são
aqueles que chegaram

Você também pode gostar