Clase01 - Conceptos Generales

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 45

Probabilidad

Teoria de Probabilidades
 Originó en juegos de azar
 Todos jugamos al riesgo día a día.
 Varios enfoques filosóficos de
probabilidad:
 Teoria Clasica
 Frecuentismo

 Bayesiana

 etc
Probabilidad
 Eventos que son comunes o improbables son
aquellos cuya probabilidad de ocurrencia son
grandes o pequeñas, respectivamente.
 Dia a dia calculamos "al ojo" la probabilidad de
todas los sucesos que nos rodean
 Determinamos que tan "común" o "raras" son.
 En Esmeraldas no es "común" encontrar un nativo
rubio y ojos azules, en Suecia si.
 Basado en "muestras" de Suecos y Esmeraldeños, sin
necesidad de ver todos los esmeraldeños y suecos.
 Problema de este método al "ojímetro“:
carecemos de un término preciso para describir
la probabilidad.
Probabilidad
 Estadísticos reemplazan como "con dificultad",
"pudo" o "casi con seguridad" por número de 0 a
1, que indica de forma precisa que tan probable
o improbable es el evento.
 Haciendo inferencias sobre una población a
partir de muestras no podemos esperar llegar
siempre a resultados correctos.
 Estadística ofrece procedimientos para saber
cuántas veces acertamos "en promedio".
(enunciados probabilísticos).
Espacio Muestreal
 El conjunto universal de una población
 Todos los valores posibles que nuestra
variable aleatoria puede tomar
 Todas las formas en que podemos sacar 4
bolas de una funda que contenga 8 bolas
rojas y 2 blancas
 De cuantas formas puede caer un dado

 Todas las posibles supervivencias que

podamos obtener en un cultivo


 Todos los posibles climas que puedan haber

en un día determinado
Probabilidad Clasica
 Si un evento puede ocurrir de N maneras
mutuamente exclusivas e igualmente posibles, y
si n de ellas tienen una característica E,
entonces, la posibilidad de ocurrencia de E es la
fracción n/N y se indica por:

 Funciona bien con espacio muestreal pequeño y


conocido, y en donde todas las N maneras sean
igualmente posibles.
Probabilidad Frecuentista
 Probabilidad de un evento es su frecuencia
relativa a lo largo del tiempo.

 Probabilidad de obtener “cara” al lanzar una


moneda es 0.5: No porque se la calcula
matemáticamente, sino porque esto ocurre al
lanzarla muchas veces.
 No se puede repetir experimento infinitas veces.
 Al repetirlo pocas veces da distinta probabilidad.
 Error de probabilidad es una probabilidad… bis…
Probabilidad
 La probabilidad que un carro sea robado en
Guayaquil puede ser calculada en función al
número de carros robados en y al número de
carros en Guayaquil.
 Aseguradoras usan esto, para calcular el valor
esperado a pagar. +costos +utilidad = prima.
 Probabilidad que en cierta camaronera una
corrida a 130.000 Pl/Ha alcance 15 gr. en 120
días puede ser calculada con base en veces que
se ha logrado en condiciones similares
Ejercicio Individual
 Calcular la posibilidad de que el sol salga
mañana.
Teoremas Basicos (1)
 La probabilidad de un evento cualquiera va
a estar en el rango de cero a uno. Esto
quiere decir que no existen probabilidades
negativas ni mayores de 100%
0 ≤ P(E) ≤ 1
Teoremas Basicos (2)
 La suma de la probabilidad de ocurrencia
de un evento mas la probabilidad de no
ocurrencia del mismo es igual a uno.
P(E) + P(¬E) = 1
 Probabilidad de que salga 1 en
lanzamiento de dados es 1/6
 Ocurrencia de que no salga 1 es:

P(¬1) = 1 – 1/6 = 5/6


Teoremas Basicos (3)
 La probabilidad de ocurrencia de dos
eventos independientes es igual al
producto de la ocurrencia de cada uno.
P(A B) = P(A) x P(B)
 Probabilidad de que al lanzar dos dados
salga 1 y 2:
 P(1) = 1/6 ; P(2) = 1/6

P(1 y 2) = 1/6 x 1/6 = 1/36


Teoremas Basicos (4)
 Para dos eventos cualesquiera A y B, la
probabilidad de que ocurra A o B viene dado, por
la probabilidad de que ocurra A, mas la
probabilidad de que ocurra B, menos la
probabilidad de que ocurran ambos.
P(A o B) = P(A) + P(B) - P(AB)
 Probabilidad que al lanzar dos dados obtenga
solo un 1 o un 2:
 P(1) = 1/6 ; P(2) = 1/6
P( 1 o 2) = 1/6 + 1/6 – (1/6 x 1/6) = 11/36
Teoremas Basicos
 Si dos eventos son mutuamente
excluyentes, P(AB) será 0 y la probabilidad
de ocurrencia de ambos será :
P(A o B) = P(A) + P(B)
 Probabilidad de que al lanzar un dado
obtenga 1 o 2:
 P(1) = 1/6 ; P(2) = 1/6

P( 1 o 2) = 1/6 + 1/6 = 2/6


Valor Esperado
 Llamamos valor esperado al valor probable que
podemos obtener al repetir cierto evento.
 Va a estar asociado a la probabilidad de
ocurrencia de cada opción del mismo, y al valor
que tomará la variable cada caso.
 Ejemplo:
 Probabilidad de que ganemos al apostar a un número
en la ruleta es 1/37 = 0.27.
 Premio obtenido es 35 veces la apuesta
 Calcule la esperanza de ganar en la ruleta apostando
US$1,000.
Valor Esperado
 P(Ganar) = 1/37
 P(Perder)= 1- 1/37 = 36/37
 Valor a Ganar = $35,000
 Valor a Perder = $1,000
 Esperanza de Ganancia:
E(G) = P(ganar)xValor Ganar + P(perder)*xValor Perder
E(G) = 1/37 x $35,000 + 36/37 x - $1,000
E(ganancia) = $946 - $973 = - $27
 Si jugamos a la ruleta, apostando toda la noche a
un número $1,000; la esperanza que tenemos es
de perder “en promedio” $27 cada vez.
Ejercicio
 Usted se Encuentra en el programa “Haga
negocios conmigo”.
 Polito le presenta 3 puertas:
 Detrás de una hay un flamante ferrari rojo
descapotable ultimo modelo.
 Detrás de las otras dos un
pectol
Haga Negocio Conmigo
 Usted debe de escoger una puerta.
 Luego de que la ha escogido, El Eterno
Perdedor abrirá de las otras dos, la que
contenga un pectol.
 En este momento usted podrá escoger:
mantenerse con la misma puerta inicial, o
cambiar por la otra puerta.
Que escogería y porque?
Parámetros
 Mayoría de investigaciones estadísticas quieren hacer
inferencias a partir de la información contenida en
muestras aleatorias sobre la población de donde fueron
obtenidas.
 Gralmente inferencias sobre los parámetros
poblacionales (ej: media  y varianza 2). Que
describen a la población.
 Se usa letras griegas.(,, ,, , etc.).
 Definimos parámetros como ciertas medidas que
describen a la población.
 A los parámetros en general los podemos definir como .
Estadísticos
 Para hacer tales inferencias utilizaremos los
estadísticos muestreales o estimadores de los
parámetros (ej: promedio o media aritmetica`x y
varianza muestreal s2)
 Valores calculadas con base en observaciones de la
muestra.
 Definimos estadístico como una medida que
describe a la muestra, y que sirve para estimar
los parámetros.
 A los estadísticos en general los podemos definir como
n .
Estadísticos vs. Parámetros
 Importante diferencia entre estadístico y
parámetro: una las bases de estadística.
 A pesar que estadísticos se usan para
representar o estimar parámetros,
probabilidad de que sean exactamente
iguales es 0.
Ej: Promedio `x
 Variable aleatoria. Distribución de probabilidad
(muestreo) depende mecanismo muestreo.
 Algunos valores `x estarán cerca de , y otros
alejados (para arriba o abajo).
 Al tomar varias muestras, queremos tener los `x
concentrados cerca a , y que el promedio de `x
esté muy cercano a .
Estimadores Insesgados Eficientes
 Queremos seleccionar un estimador y un plan de
muestreo que:
1. Nos asegure que la esperanza de el estimador
sea el parámetro (E(0) = ) Insesgado

2. La varianza del estimador tenga la menor


varianza posible (2(0) → sea baja) Eficiente

 De dos estadísticos 1 y 2, el que tenga menor


varianza será el mas eficiente.
Error de Estimación
 Conociendo el estadístico 0 usado, y su
distribución de probabilidad, podemos evaluar su
error de estimación.
 “El valor absoluto de la diferencia entre el
estadístico y el parámetro” (E=0 - ).
 No sabemos exactamente cuanto es
(desconocemos parámetro ),
 Podemos encontrar límites entre los cuales
existe una probabilidad de que se encuentre el
parámetro :
 P(0 - )  1-.
Estadísticos de Centralización
Ejercicio02a - Estadisticos.xlsx
 Media poblacional :
 La media aritmética de datos de toda la población
 Representa esperanza matemática de variable
aleatoria:

 Este parámetro no lo conocemos, y no lo


conoceremos nunca a no ser que
muestreáramos la población completa.
 Para estimarlo usamos el estadístico promedio o
media muestreal `x.
Estadísticos de Centralización
 Promedio o media poblacional`x :
 La media aritmética de los datos de la muestra

 Al ser m la esperanza matemática de los `x, esta


puede calcularse también de la siguiente forma:

 j es j-esimo grupo de un total de k grupos


 nj es el número de individuos en el j-esimo grupo
 `xj es la media del j-esimo grupo
Estadísticos de Centralización
 Promedio ponderado
Estadísticos de Centralización
 Moda: Marca de clase del intervalo con mayor
frecuencia
 Aproximadamente: Valor que mas encontramos en
nuestro muestreo.
 Mediana: valor más cercano a la mitad si los
ordenamos, o valor con igual número de datos
mayores que menores a él.
 Valor del dato número (n+1)/2 cuando n es impar
 Media del dato # (n/2) y el dato # (n/2 +1) cuando n es
par.
Estadísticos de Dispersión
 Medidas de centralización dan una idea de hacia
dónde están distribuidos nuestros datos, pero no
de cómo están distribuidos.
 Probabilidad de dato igual a la media tiende a 0
 Media de posibles valores un dado 3.5
 Cruce de Rio; Pies en horno, cabeza refrigerador
 Dos poblaciones con igual media pero dispersión
de datos distinta: Poblaciones distintas
Estadísticos de Dispersión
 Parámetro varianza poblacional 2 :
 Promedio de cuadrados de las desviaciones
de los valores de una variable en población
con respecto a media poblacional

 xi- es distancia de cada punto a la media


 Se eleva al cuadrado porque si no distancias
positivas y negativas se anularían dando 0
Varianza
 Fisher (1918) “The Correlation Between Relatives on the
Supposition of Mendelian Inheritance”
 El gran cuerpo de las estadísticas disponibles nos muestran que
las desviaciones de una medida humana de su media siguen
muy de cerca la ley normal de los errores, y, por tanto, que la
variabilidad puede ser medida de manera uniforme por la
desviación estándar correspondiente a la raíz cuadrada de la
media del cuadrado del error.
 Cuando hay dos causas de variabilidad independientes, capaces
de producir en una distribución poblacional de otra manera
uniforme, con desviaciones estándar θ1 y θ2, se encuentra que
la distribución, cuando ambas causas actúan juntas, tiene una
desviación estándar
 Por tanto, es conveniente en el análisis de las causas de la
variabilidad, trabajar con el cuadrado de la desviación estándar
como la medida de la variabilidad. Vamos a llamar esta cantidad,
la varianza
Propiedades de la Varianza (1)
1. Es positiva (2)
2. Es en distintas unidades que la variable (2)
3. No varía por localización. Sumar constante a todos los
datos: misma varianza. Var(x + a) = Var(x)
4. Si se multiplica todos los datos por una constante,
varianza se multiplica por constante2 Var(ax) = a2Var(x)
5. La varianza de la suma de variables aleatorias es igual
a la suma de sus varianzas + 2 veces su covarianza.

6. Generalizando para N Variables


Propiedades de la Varianza (2)
7. Varianza = Promedio de cuadrados – el cuadrado del
promedio
Var (X)= 1/N Sxi2 - `x2
8. La varianza de la suma de variables aleatorias
independientes es igual a la suma de sus varianzas:
Var(X + Y) = Var(X) + Var (Y)
generalizando:

9. Si las variables independientes tienen la misma


varianza, la varianza de su promedio puede
transformarse multiplicando por (1/n)2 (4).

*Recordar este s2/n para teorema central del limite


Estadísticos de Dispersión
 Varianza empírica s2 es el estadístico mediante
el cual hacemos estimaciones de nuestro
parámetro varianza poblacional.
 Ya que s2 sería estimador sesgado de s2 si la
dividimos para n, se la divide por n-1:

 A medida que tamaño de la muestra (n)


aumenta, sesgo entre 2 y s2 disminuye
Estadísticos de Dispersión
 La desviación típica o desviación estándar ( o
s), es la raíz cuadrada positiva de la varianza. s
es estimador sesgado de s.
 El rango es la diferencia entre el valor del mayor
dato y el valor del menor dato.
 Desviación media: promedio de las desviaciones
absolutas respecto al promedio: DM=S|xi-`x|/n
 Error típico de la media: estima s para la
distribución de`x: S`x = s / √n
 Coeficiente de variación: expresión porcentual
de variación (sin unidades): CV= s x 100 /`x
Est. Disp. Usan 1 decimal más que la muestra
Introduccion al Excel Como
Herramienta Estadistica
 Versatilidad:
 Hoja de calculo
 Base de datos  Otros Objetos:
 Diagramador  Row
 Lenguaje de  Column
programación  Cell
 Análisis de datos  Area
 Modelo de objeto:  Rangos con Nombre
 Aplication
 Workbook
 Worksheet
 Range
 Otros objetos:
Interfaz de Usuario?
 Ventanas
 Menu de Excel 2003 y anteriores
 Cinta de opciones Excel 2007
 Barra(s) de Herramientas
 Barra de formulas
 Cuadro de nombres
 Barra de estado
 Macros
 Complementos
 Archivos personales
 Entrada de datos e interfaz con el usuario
Tipos de Datos/Objetos?
 Texto
 Números
 Formatos
 Fórmulas
 Referencias absolutas y relativas

 Funciones
 Matrices
 Referencias Remotas
 Comentarios
 Gráficos
 Tablas y gráficos dinámicos
 Otros objetos
Operaciones Básicas?
 Desplazamiento
 Teclas de acceso rápido
 Funciones Mouse
 Selección
 Direcciones relativas y absolutas
 Nombres de rango
 Copiar, Cortar. Pegar , Pegado Especial.
 Asistentes
 Personalización
Funciones Estadisticas
 Muchas
 Muy Utiles
 Algunas no se para que son o no las he
usado
 Aplasten F1 y lean de que se tratan
 Pruebenlas y comparenlas con calculos
“manuales”.
 Revisaremos las mas frecuentes.
 Existen rutas alternas en Excel
Herramientas de Analisis de
Datos
 Complemento de Excel
 Existen otros complementos estadisticos
de terceros
 Tienen sus ventajas y sus limitaciones
 Existen rutas alternas en Excel
Herramientas No Estadisticas
Utiles Para la Estadistica
 Modelo de Hoja de Calculo
 Formulas
 Funciones no Estadisticas
 Ordenar, filtrar.
 Graficos
 Tablas Dinamicas y Graficos
 ODBC, conecciones y otros datos
externos
 Macros
Ejercicio Practico
 Calcular en Ejercicio02b - Estadisticos.xlsx:
 Suma
 n
 `x
 Moda
 Mediana
 s2 y s
 Maximo, mínimo y rango
 Error típico, coeficiente de variación
 Analisis de Datos / Estadistica Descriptiva
Usar Formula y Función

También podría gustarte