Álgebra y 3. Manejo de La Información Estadística Temario Comipems

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 40

2.

Álgebra
Curso Matemáticas, ingreso al bachillerato.

2.1 Significado y uso de las literales


La parte literal es formada por las mismas letras que intervienen en los monomios
del producto, con el exponente de la respectiva literal igual a la suma de los
exponentes.

El uso de literales se da en ecuaciones, en polinomios, en límites, en integrales y


en derivadas especialmente que cualquier letra tiene significado distinto, por
ejemplo, la letra significa derivar.

Expresión común de problemas algebraicos de adición y sustracción:


La suma o adición es la operación binaria que tiene por objetivo el reunir dos o más
sumandos

Monomios:
Estas expresiones algebraicas son del tipo axn en donde a representa un número
real que se denomina coeficiente, y x es una indeterminada, es decir un elemento
no conocido al que llamaremos parte literal.
Ejemplo de Monomios:

, 3x2, 2a.
En donde: 3, 2 son coeficientes
POLINOMIOS
Es una expresión algebraica que consta de más de un término. Se expresan de la
forma.
a+b, a+x-y, x3 +2x2+x+7
Los polinomios se clasifican en.
Binomios: Es decir un polinomio que tiene dos términos
Ejemplo:
a+b, x-y,

Trinomios:
Son polinomios que contienen tres términos
Ejemplos:
a+b+c, x2-5x+6, 5x2-6y+a2

PROPIEDADES DE LA SUMA ALGEBRAICA


1. PROPIEDAD DE CERRADURA: la suma de dos o más polinomios dará como
resultado otro polinomio.
2. PROPIEDAD CONMUTATIVA: el orden de los sumandos no altera el resultado de
la suma.
Sean A y B dos polinomios, entonces se cumple que A+B=B+A
3. PROPIEDAD ASOCIATIVA: la suma es una operación binaria, que se realiza
tomando dos sumandos, de una serie de ellos, obteniendo un resultado parcial, y
éste sumándolo con el siguiente sumando, y así sucesivamente, hasta agregar
todos los sumandos al resultado final. Esto puede hacerse comenzando desde la
izquierda (lo usual) o desde la derecha (a causa de la propiedad conmutativa).

Sean A, B, C tres polinomios, entonces se cumple que (A+B)+C=A+(B+C)


4. PROPIEDAD DE NEUTRO ADITIVO: existe un polinomio, llamado NEUTRO que al
sumarse con cualquier otro polinomio no lo altera. Este NEUTRO es el 0. Sean A y
0 dos polinomios entonces se cumple que: A + 0 = A

Operaciones de Sumas y Restas de Expresiones Algebraicas


1. PROPIEDAD DEL INVERSO ADITIVO: para cada polinomio queda definido otro
que se llama su INVERSO ADITIVO, al sumarse ambos dan como resultado el
NEUTRO ADITIVO de los polinomios.
Sean A y -A dos polinomios que son inversos aditivos entre sí, entonces se cumple
que: A + (-A) = 0

RESTA
La resta, diferencia o sustracción es la operación binaria que tiene por objetivo hallar
el sumando desconocido
Otra definición dice que la resta es la operación inversa de la suma o también que
es una operación de comparación, en la que se establece la diferencia entre dos
polinomios, o bien lo que le falta a un polinomio para llegar a ser igual al otro. . Y
hay quienes van a afirmar que la resta es el resultado de sumar a un polinomio dado
llamado minuendo, el inverso aditivo de otro polinomio que en tal caso se llamará
sustraendo.

CARACTERÍSTICAS DEL MINUENDO


El minuendo es el polinomio que va a DISMINUIR.

CARACTERÍSTICAS DEL SUSTRAENDO


El sustraendo es el polinomio que representa CUANTO VA A DISMINUIR el
minuendo.

PROPIEDADES DE LA RESTA ALGEBRAICA


PROPIEDAD DE CERRADURA: la resta o diferencia de dos polinomios dará como
resultado otro polinomio.

NO HAY PROPIEDAD CONMUTATIVA: el orden de minuendo y


sustraendo si altera el resultado de la resta.
Sean A y B dos polinomios, entonces se cumple que A-B ≠ B-A

NO HAY PROPIEDAD ASOCIATIVA: la resta solo puede hacerse entre dos


polinomios.

Consecuencias de la propiedad de cerradura en la resta algebraica


Sean tres polinomios m (minuendo), s (sustraendo) y d (la resta o diferencia), es
posible verificar las siguientes situaciones:
M - S = D, la diferencia es el resultado de restar el sustraendo al minuendo.
M = D + S, el minuendo será el resultado de sumar la diferencia con el sustraendo,
o bien que el sustraendo es lo que le falta a la diferencia para ser igual al minuendo.
S = M - D, el sustraendo será el resultado de restar la diferencia al minuendo, o bien
que la diferencia es lo que le falta al sustraendo para ser igual al minuendo.

Resolución de problemas con expresiones algebraicas


Ejemplo:

Ecuación 1

Para resolver la ecuación, debemos pasar los monomios que tienen la


incógnita a una lado de la igualdad y los que no tienen la incógnita al
otro lado.

Como 8 está restando en la derecha, pasa sumando al lado izquierdo:

Como x está restando en la izquierda, pasa restando a la derecha:

Ahora que ya tenemos separados los monomios con y sin la incógnita,


podemos sumarlos. En la izquierda, sumamos 2+82+8 y, en la
derecha, x+xx+x:

Para ver con claridad el paso siguiente, escribimos 2x2x como un


producto:

Para terminar, debemos pasar el coeficiente de la incógnita (el número


2 que multiplica a xx) al lado izquierdo. Como el número 2 está
multiplicando, pasa dividiendo:
Simplificando la fracción,

Por tanto, la solución de la ecuación es x=5x=5. Para comprobar la


solución, sustituimos xx por 5 en la ecuación:

Como hemos obtenido una igualdad verdadera (-3 es igual a -3), la


solución es correcta. Si, por el contrario, obtenemos una igualdad falsa,
significa que hemos cometido algún error en la resolución de la
ecuación.

Resolver:

Solución
Resolución de problemas con expresiones algebraicas.

Ejemplo:
Encontrar el número que cumple que la suma de su doble y
de su triple es igual a 100.

Si X es el número que buscamos, su doble es 2⋅x y su triple es 3⋅x.


La suma de los dos últimos debe ser 100:

Resolviendo la ecuación:

El número buscado es 20.

En efecto, el doble de 20 es 40, su triple es 60 y ambos números


suman 100.
Resolver:

Si Ana es 12 años menor que Eva y dentro de 7 años la edad de


Eva es el doble que la edad de Ana, ¿qué edad tiene Eva?

Si 25,5 es el 15% de una cierta cantidad, ¿cuál es el 80% de


dicha cantidad?

Hallar el número X sabiendo que la cuarta parte de la quinta


parte de la tercera parte de X es 3.
Sistema de ecuaciones lineales de dos ecuaciones con dos incógnitas
Resolución de sistemas lineales de dos ecuaciones con dos incógnitas
Un sistema lineal de dos ecuaciones con dos incógnitas es un sistema lineal de
ecuaciones formado por sólo dos ecuaciones que admite un tratamiento
particularmente simple, fácil y rápido junto con el caso trivial de una ecuación lineal
con una única incógnita, es el caso más sencillo posible de sistemas de ecuaciones,
y que permiten su resolución empleando técnicas básicas del álgebra cuando los
coeficientes de la ecuación se encuentran sobre un cuerpo (sobre un anillo la
solución no es tan sencilla).
Sistema de dos ecuaciones lineales con dos incógnitas
Un sistema de dos ecuaciones lineales con dos incógnitas tiene la siguiente
estructura:

4x – 3y = 5

2x + 7y = 6

Cada ecuación representa una recta en el plano. La solución será el punto de


corte de ambas rectas.

Solucionar este sistema de ecuaciones es encontrar los pares de valores de “x1” -


“y1” que hacen cumplir ambas igualdades.
La solución de este sistema será precisamente el punto de corte de ambas rectas.

En un sistema de 2 ecuaciones con 2 incógnitas puede ocurrir:

a) Que tenga una única solución. Como en el ejemplo anterior. Se denomina


“sistema compatible determinado”. Las dos ecuaciones representan a dos rectas
que se cortan en un solo punto.

b) Que tenga infinitas soluciones. Se denomina “sistema compatible


indeterminado”. Las dos ecuaciones representan a dos rectas superpuestas, una
encima de otra (coinciden en todos los puntos).

c) Que no tenga ninguna solución. Se denomina “sistema incompatible”. Las dos


ecuaciones representan a dos rectas paralelas y que por tanto no tienen ningún
punto en común.
Resolución de un sistema lineal de dos ecuaciones

Existen 3 métodos para resolver un sistema de 2 ecuaciones lineales con 2


incógnitas:

• Método de sustitución.
• Método de igualación.
• Método de reducción.

En todos ellos hay que operar previamente con las ecuaciones con vistas a
simplificarlas.

Repasamos a continuación aquellas transformaciones que se pueden hacer con


ecuaciones y que nos permiten obtener ecuaciones equivalentes (ecuaciones que
tienen la misma solución).

Criterios de equivalencia

Una ecuación es equivalente a otra cuando tiene la misma solución.

a) Si a ambos miembros de una ecuación se le suma un mismo valor o una misma


expresión la ecuación resultante es equivalente.

Ejemplo:
Dada la ecuación: 3x -2 = 4x + 7

La ecuación 3x -2 + 5 = 4x + 7 + 5 es equivalente a la anterior

Ejemplo:

Dada la ecuación: 3x -2 = 4x + 7

La ecuación 3x -2 – 2x = 4x + 7 – 2x es equivalente a la anterior

b) Si ambos miembros de una ecuación los multiplicamos o dividimos por un


mismo valor distinto de cero la ecuación resultante es equivalente.

Ejemplo:

Dada la ecuación: 3x -2 = 4x + 7

La ecuación (3x -2) * 3 = (4x + 7) * 3 es equivalente a la anterior

Ejemplo:

Dada la ecuación: 3x -2 = 4x + 7

La ecuación (3x -2) / 6 = (4x + 7) / 6 es equivalente a la anterior

c) Dado un sistema de ecuaciones, si a una ecuación del sistema le sumamos /


restamos otra ecuación del mismo sistema, el sistema resultante es equivalente al
inicial.

Ejemplo: Dado el sistema:

3x -2 = 4x + 7

2x – 5 = x

Sumamos a la primera ecuación la segunda:


3x -2 + 2x – 5 = 4x + 7 + x

El nuevo sistema es equivalente al inicial:

3x -2 + 2x – 5 = 4x + 7 + x

2x – 5 = x

Esta regla también se cumple si la ecuación que vamos a sumar / restar


previamente hemos multiplicado / dividido sus dos miembros por un mismo
número distinto de cero, ya que según vimos anteriormente hubiéramos obtenido
una ecuación equivalente.

Ejemplo: dado el sistema:

3x -2 = 4x + 7

2x – 5 = x

Sumamos a la primera ecuación la segunda, pero previamente multiplicamos los


dos miembros de esta segunda ecuación por un mismo valor:

3x -2 + (2x – 5) * 5 = 4x + 7 + (x) * 5

El nuevo sistema es equivalente al inicial:

3x -2 + 10x – 25 = 4x + 7 + 5x

2x – 5 = x

Resolución de problemas con sistemas de dos ecuaciones lineales con dos


incógnitas:

Ejemplo:
Encontrar dos números cuya suma sea 45 y cuya resta sea 21.
ución

Los números son X e Y. Como deben sumar 45,

Como deben restar 21,

El sistema de ecuaciones es

Lo resolvemos por el método de reducción restando las


ecuaciones:

Sustituimos el valor de Y en la primera ecuación para calcular el


valor de X:
Por tanto, los números cuya suma es 45 y cuya resta es 21 son
12 y 33.

Resolver:

Hallar un número de dos cifras sabiendo que la suma de las cifras


es 12 y que la primera de ellas es el triple de la segunda.

Alberto y su padre se llevan 25 años de edad. Calcular la edad


de Alberto sabiendo que dentro de 15 años la edad de su padre
será el doble que la suya.
Ecuación de segundo grado
Productos notables y factorización

Son aquellos productos que se rigen por reglas fijas y cuyo resultado puede hallarse
por simple inspección. Su denominados también "Identidades Algebraicas". Son
aquellos productos cuyo desarrollo es clásico y por esto se le reconoce fácilmente. Las
más importantes son :

Binomio de Suma al Cuadrado: El Cuadrado del primer Término, más el Doble


Producto del Primer por el segundo Término, más el Cuadrado del Segundo Término.

( a + b )2 = a2 + 2ab + b2

Binomio Diferencia al Cuadrado: El Cuadrado del primer Término, menos el Doble


Producto del Primer por el segundo Término, más el Cuadrado del Segundo Término.

( a - b )2 = a2 - 2ab + b2

Diferencia de Cuadrados: El Cuadrado del Primer Término menos El Cuadrado del


Segundo Término.

( a + b ) ( a - b ) = a2 - b2

Producto de dos binomios que tienen un término común: El cuadrado del término
común, más el producto de termino común por la suma de los términos no comunes,
más el producto de los términos no comunes.

( x + a)(x + b) = x2 + ( a + b) x + ab

Binomio Suma al Cubo: El Cubo del Primer Término, más el triple producto del
cuadrado del primer por el segundo Término, más el triple producto del primer por el
cuadrado del segundo Término, más el cubo del segundo Término.

( a + b )3 = a3 + 3 a2b + 3 ab2 + b3 = a3 + b3 + 3 ab (a + b)

Binomio Diferencia al Cubo El Cubo del Primer Término, menos el triple producto del
cuadrado del primer por el segundo Término, más el triple producto del primer por el
cuadrado del segundo Término, menos el cubo del segundo Término.

( a - b )3 = a3 - 3 a2b + 3 ab2 - b3

Suma de dos Cubos: Se saca raíz cubica a cada uno de los dos términos cúbicos,
para obtener un binomio (la suma de dos números), y en base a ese binomio, se utiliza
la siguiente regla para obtener un trinomio: el cuadrado del primero, menos el producto
del primero por el segundo, más el cuadrado del segundo.

a3 + b3 = ( a + b ) ( a2 – ab + b2)
Diferencia de Cubos Se saca raíz cubica a cada uno de los dos términos cúbicos, para
obtener un binomio (la diferencia de dos números), y en base a ese binomio, se utiliza
la siguiente regla para obtener un trinomio: el cuadrado del primero, más el producto
del primero por el segundo, más el cuadrado del segundo.

a3 - b3 = ( a - b ) ( a2 + ab + b2)

Trinomio Suma al Cuadrado o Cuadrado de un Trinomio: El cuadrado del primer


término, más el cuadrado del segundo término, más el cuadrado del tercer término, más
el doble producto del primero por el segundo, más el doble producto del segundo por el
tercero, más el doble producto del tercero por el primero.

( a + b + c)2 = a2 + b2 + c2 + 2ab + 2bc + 2ac = a2 + b2 + c2 + 2 ( ab + bc + ac)

Trinomio Suma al Cubo

( a + b + c)3 = a3 + b3 + c + 3(a + b) . (b +c) . (a + c)

Identidades de Legendre

( a + b)2 + ( a – b)2 = 2 a2 2b2 = 2(a2 + b2)

( a + b)2 + ( a – b)2 = 4 ab
Resumen:

Resolución de ecuaciones de segundo grado


Para resolver ecuaciones de segundo grado necesitamos tener el polinomio igualado a
cero. El término a es el coeficiente cuadrático, es decir, es distinto de 0. b es el coeficiente
lineal y c es el término independiente. A la hora de representar esta función se hace
como una parábola.
El método de resolución es a través de una fórmula matemática que nos da los distintos
valores que toma x en la función. Esto son los puntos en los que la parábola corta el eje
x en la función en los puntos donde y es 0. Por eso mismo nos da dos números, porque la
parábola corta en dos puntos.

Son ecuaciones de segundo grado aquellas en las que la incógnita aparece al menos una
vez elevada al cuadrado (x2 ). Por ejemplo: 3x2 - 3x = x - 1.

Pasemos al primer miembro de la ecuación todos los términos de forma que en el segundo
miembro quede 0. Obtenemos:

3x2 - 4x + 1 = 0, que es la forma en que deberemos expresar todas la ecuaciones de


segundo grado para resolverlas.
En muchos casos, una vez conseguida esta forma, la ecuación se puede simplificar, lo cual
es muy conveniente. Por ejemplo:

Ejercicio 1.- Expresar en la forma más simple y simplificada posible, la ecuación:

3x2 - 3x/2 = x/2 - x + 2 + x2

Primero se aplica lo de denominador común para eliminar los denominadores existentes.


Llegaremos a:

6x2 - 3x = x - 2x + 4 + 2x2

Expresando todos los términos en el primer miembro: 4x2 - 2x - 4 = 0

y simplificando (dividiendo todo por 2): : 2x2 - x - 2 = 0.

SOLUCIÓN GENERAL DE LA ECUACIÓN DE SEGUNDO GRADO

Como vimos en la descripción, cualquier ecuación de segundo grado se puede expresar de


la forma:

ax2 +bx + c = 0

donde a, b y c serán números enteros (positivos o negativos). Para ello bastará obtener el
denominador común (si hay denominadores), para eliminarlo y pasar todos los términos al
primer miembro.

Sabemos que una vez conseguida dicha forma, las dos "posibles" soluciones de la ecuación
son:

Así la ecuación del ejemplo inicial: 3x2 - 4x + 1 = 0: tendrá por soluciones:

Luego 1 y 0,33 son las dos soluciones o raíces de la ecuación.


Por tanto:

"Si la parábola corta al eje X en dos puntos, los valores de x en esos puntos son la dos
soluciones o raíces de la ecuación de segundo grado"

Recordatorio

La forma general de una ecuación de segundo grado es:

Por comodidad, resolveremos la ecuación de tres formas distintas según los valores de los
coeficientes b y c.

Se llama discriminante, Δ, a

El signo de Δ nos permite conocer el tipo de soluciones de la ecuación:

• Si Δ>0, hay dos soluciones reales distintas.


• Si Δ=0, hay dos soluciones reales iguales.
• Si Δ<0, no hay soluciones reales (hay dos soluciones complejas distintas).

Caso 1

Si b, c≠0, se dice que la ecuación es completa y sus soluciones las proporciona la fórmula

En los siguientes casos, las ecuaciones se dice que son incompletas:

Caso 2

Si b=0, la ecuación es de la forma

Las soluciones son


Caso 3

Si c=0, la ecuación es de la forma

Las soluciones son

Caso 4

Si b=c=0, la ecuación es de la forma

La única solución es

Resolver:

Determinar el tipo y número de soluciones de la ecuación


Resolver la ecuación de segundo grado incompleta

Relaciones de proporcionalidad directa


Dos magnitudes son directamente proporcionales si al incrementarse o disminuir una
de ellas, la otra lo hace en la misma proporción.

Por ejemplo:

2 camisas cuestan 30 dólares

Si el número de camisas se incrementa (por ejemplo, lo multiplicamos por 2) el precio


aumenta en la misma proporción

4 camisas cuestan 60 dólares (el precio también se ha multiplicado por 2).

Si el número de camisas disminuye (por ejemplo, lo dividimos por 2) el precio lo hace


también en la misma proporción

1 camisa cuesta 15 dólares

Por lo tanto, el número de camisas y su precio son dos magnitudes directamente


proporcionales.

Se denomina “Constante de proporcionalidad directa” la relación que existe entre


ambas magnitudes. Se obtiene dividiendo una de ellas por la otra.

En el ejemplo: si 2 camisas cuestan 30 dólares

Contante de proporcionalidad directa = 30 / 2 = 15


Esta relación se mantiene constante para cada par de valores (nº camisas / precio).

4 camisas cuestan 60 dólares: Contante de proporcionalidad directa = 60 / 4 = 15


1 camisa cuesta 15 dólares: Contante de proporcionalidad directa = 15 / 1 = 15

Si el valor de la constante de proporcionalidad varía para distintos pares de valores de estas


magnitudes, entonces están no serían directamente proporcionales.

Ejemplo: un obrero tarda 10 horas en levantar un muro, 18 horas en levantar dos, y 24 horas
en levantar tres.

Contante de proporcionalidad directa = 10/1 = 10


Contante de proporcionalidad directa = 18 / 2 = 9
Contante de proporcionalidad directa = 24 / 3 = 8

Vemos por tanto que ambas magnitudes no son directamente proporcionales.

Relación de proporcionalidad inversa

La relación entre dos magnitudes también puede ser inversamente proporcional, es decir,
que cuando una de las magnitudes aumenta en una proporción, la otra disminuye en la
misma proporción.

Por ejemplo: Un agricultor tarda 4 días en arar una finca, mientras que 2 agricultores tardan
8 días.

En este ejemplo, mientras que el número de agricultores se ha multiplicado por 2, los días
necesarios para realizar esta labor han quedado divididos por la misma magnitud.

La “Constante de proporcionalidad inversa” es la relación que hay entre 2 magnitudes


inversamente relacionadas, y se calcula multiplicando una por otra.

En el ejemplo de 1 trabajador que tarda 4 horas:

1x4=4

Esa proporción de mantiene constante en los distintos valores que pueden tomar ambas
magnitudes.

En el ejemplo de 2 trabajadores que tardan 2 horas:

2x2=4
Relaciones de proporcionalidad en el plano cartesiano
Mediante el uso de las gráficas se pueden interpretar y explicar situaciones
diversas, por ejemplo:
• El crecimiento de la población en determinada región del país en un
periodo de tiempo.
• La variación del peso de un bebé a lo largo de cierto periodo de
tiempo.
• El índice de natalidad en un país a través del tiempo.
En la secuencia 7, “Cómo es y dónde está la población”, de su libro
de Geografía de México y el mundo estudiaron la distribución de la población
en México. La siguiente es una gráfica que muestra el crecimiento de la
población de nuestro país en los últimos 8 años.

Crecimiento de la población en los últimos 8 años

Para localizar e interpretar los puntos de una gráfica se hace uso de sus
coordenadas. Las coordenadas del punto A son (2004,104), esto quiere decir
que en el año 2004 había 104 millones de habitantes. En la primera coordenada
del punto, llamada abscisa, van los años, y en la segunda coordenada del punto,
llamada ordenada, el número de habitantes que hubo en ese año. El
punto A tiene como abscisa a 2004 y como ordenada a 104.
De acuerdo con la información de la gráfica, respondan lo siguiente:
a) ¿En qué año había 102 millones de habitantes?__________________

b) ¿En qué año había 95 millones de habitantes?___________________


c Localiza el punto que tiene ordenada 96. ¿Cuál es su
) abscisa? _________________________________________________
____
¿A qué año corresponde este punto? ____________________________
¿Cuántos millones de habitantes hubo en ese año?__________________

3. Manejo de la información estadística


Análisis de la información estadística: Índices

Análisis de Datos Estadístico


La estadística es básicamente una ciencia que implica la recopilación de datos, la
interpretación de datos y, finalmente, la validación de datos. El análisis de datos
estadístico es un procedimiento para realizar diversas operaciones estadísticas.
Es un tipo de investigación cuantitativa que busca cuantificar los datos y, por lo general,
aplica alguna forma de análisis estadístico.

Los datos cuantitativos básicamente involucran datos descriptivos, como datos de


encuestas y datos de observación.

El análisis de datos estadísticos generalmente involucra alguna forma de herramientas


estadísticas. Hay varios paquetes de software para realizar análisis de datos estadísticos.

Estos software incluyen el Sistema de análisis estadístico (SAS), el Paquete estadístico


para las ciencias sociales (SPSS), Stat soft, R, etc.

Los datos en el análisis de datos estadísticos consisten en variables. En ocasiones, los


datos son univariados o multivariantes. Dependiendo del número de variables, el
investigador usa diferentes técnicas estadísticas.

Si los datos en el análisis de datos estadísticos son múltiples en números, entonces se


pueden realizar varios multivariados. Estos son análisis de datos estadísticos factoriales,
análisis de datos estadísticos discriminantes, etc.

De forma similar, si los datos son singulares en número, entonces se realiza el análisis de
datos estadísticos univariado. Esto incluye la prueba t para significancia, prueba z, prueba
f, ANOVA, etc.

Tipos de Datos en el análisis estadístico

- Tipos de Datos estadísticos


Los datos en el análisis de datos estadístico son básicamente de 2 tipos, datos continuos y
datos discretos. La información continua es la que no puede ser contada. Por ejemplo, la
intensidad de una luz puede medirse, pero no puede contarse. La información discreta es
la que puede ser contada. Por ejemplo, se puede contar el número de bombillas.
Los datos continuos en el análisis de datos estadísticos se distribuyen bajo la función de
distribución continua, que también se puede llamar función de densidad de probabilidad o
fdp.

Los datos discretos en el análisis de datos estadísticos se distribuyen bajo la función de


distribución discreta, que también se puede llamar la función de masa de probabilidad fmp.

Usamos la palabra "densidad" en datos continuos de análisis de datos estadísticos porque


la densidad no se puede contar, pero se puede medir. Usamos la palabra "masa" en datos
discretos de análisis de datos estadísticos porque la masa no se puede contar.

Hay varias fdp y fmp en el análisis de datos estadísticos. Por ejemplo, la distribución de
Poisson es la fmp comúnmente conocida, y la distribución normal es la fdp comúnmente
conocida.

Estas distribuciones en el análisis de datos estadísticos nos ayudan a comprender qué


datos corresponden a qué distribución. Si los datos son sobre la intensidad de una bombilla,
entonces los datos caerían en la distribución de Poisson.
Medidas Principales

Media

La media aritmética, más comúnmente conocida como "el promedio", es la suma de una
lista de números dividida por el número de elementos en la lista.

La media es útil para determinar la tendencia general de un conjunto de datos o


proporcionar una instantánea rápida de sus datos. Otra ventaja de la media es que es muy
fácil y rápida de calcular.
Problemas
Tomado sola, la media es una herramienta peligrosa. En algunos conjuntos de datos, la
media también está estrechamente relacionada con el modo y la mediana (otras dos
medidas cercanas al promedio).

Sin embargo, en un conjunto de datos con un alto número de valores atípicos o una
distribución sesgada, el promedio simplemente no proporciona la precisión que necesita
para una decisión.

Desviación estándar

La desviación estándar, a menudo representada con la letra griega sigma, es la medida de


una dispersión de datos alrededor de la media.

Una desviación estándar alta significa que los datos se distribuyen más ampliamente desde
la media, donde una baja desviación estándar indica que más datos se alinean con la media.

Dentro de los métodos de análisis de datos, la desviación estándar es útil para determinar
rápidamente la dispersión de puntos de datos.
Problemas
Al igual que la media, la desviación estándar es engañosa si se toma sola. Por ejemplo, si
los datos tienen un patrón muy extraño, como una curva no normal o una gran cantidad de
valores atípicos, la desviación estándar no le dará toda la información que necesita.

Regresión

La regresión modela las relaciones entre variables dependientes y explicativas, que


generalmente se grafican en un diagrama de dispersión. La línea de regresión también
designa si esas relaciones son fuertes o débiles.

La regresión se enseña comúnmente en cursos de estadística de la escuela secundaria o


la universidad con aplicaciones para la ciencia o los negocios para determinar tendencias
a lo largo del tiempo.
Problemas
La regresión no es muy matizada. A veces, los valores atípicos en un diagrama de
dispersión (y las razones para ellos) son importantes.

Por ejemplo, un punto de datos periférico puede representar la entrada de su proveedor


más crítico o su producto más vendido.

La naturaleza de una línea de regresión, sin embargo, lo tienta a ignorar estos valores
atípicos.

Tamaño de la muestra

Al medir un gran conjunto de datos o población, como una fuerza de trabajo, no siempre es
necesario recopilar información de cada miembro de esa población: una muestra puede ser
suficiente. El truco es determinar el tamaño correcto para que una muestra sea precisa.

Usando métodos de proporción y desviación estándar, puede determinar con precisión el


tamaño de muestra correcto que necesita para hacer que su recopilación de datos sea
estadísticamente significativa.
Problemas
Al estudiar una nueva variable no probada en una población, sus ecuaciones de proporción
podrían necesitar ciertas suposiciones. Sin embargo, estas suposiciones pueden ser
completamente inexactas. Este error luego se transfiere a la determinación del tamaño de
la muestra y luego al resto de su análisis de datos estadísticos.

Pruebas de Hipótesis

También comúnmente denominado prueba t, la prueba de Hipótesis evalúa si una


determinada premisa es realmente cierta para su conjunto de datos o población. En el
análisis de datos y las estadísticas, considera que el resultado de una prueba de Hipótesis
es estadísticamente significativo si los resultados no pudieron haber ocurrido por
casualidad.

Las pruebas de Hipótesis se utilizan en todo, desde la ciencia y la investigación hasta los
negocios y la economía.
Problemas
Para ser riguroso, las pruebas de Hipótesis deben tener en cuenta los errores comunes.
Por ejemplo, el efecto placebo ocurre cuando los participantes esperan falsamente un
determinado resultado y luego perciben (o realmente alcanzan) ese resultado.

Otro error común es el efecto Hawthorne (o efecto observador), que ocurre cuando los
participantes sesgan los resultados porque saben que están siendo estudiados.
Tablas de frecuencia absoluta y relativa
Las Tablas de frecuencias son herramientas de Estadística donde se colocan los
datos en columnas representando los distintos valores recogidos en la muestra y
las frecuencias (las veces) en que ocurren.

Datos

Los datos son los valores de la muestra recogida en el estudio estadístico

Frecuencia absoluta

La frecuencia absoluta (ni) es el número de veces que aparece un determinado valor en un


estudio estadístico. Número de veces que se repite el í-esimo valor de la variable. La suma
de las frecuencias absolutas es igual al número total de datos, que se representa por n

Frecuencia absoluta acumulada

La Frecuencia absoluta acumulada (Ni) es la suma de las frecuencias absolutas de todos


los valores inferiores o iguales al valor considerado.

N1 = n1

N2 = n1 + n2 = N1 + n2

N3 = n1 + n2 + n3 = N2 + n3

Nk = n.

Se interpreta como el número de observaciones menores o iguales al í-esimo valor de la


variable.

Frecuencia relativa

La frecuencia relativa (fi) es la proporción de veces que se repite un determinado dato.

La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y


el número total de datos.

fi = ni/n

La suma de las frecuencias relativas es igual a 1.

Frecuencia relativa acumulada

La frecuencia relativa acumulada (Fi) es el número de observaciones menores o iguales al


í-esimo valor de la variable, pero en forma relativa.

F1 = fl

F2 = f1+ f2 = F1 + f2

F3 = f1+ f2 + f3 = F2 + f3
Fk = 1

Tabla de frecuencia de datos no agrupados

Los datos no agrupados son las de observaciones realizadas en un estudio estadístico que
se presentan en su forma original tal y como fueron recolectados, para obtener información
directamente de ellos.

La Tabla de frecuencia de datos no agrupados indica las frecuencias con que aparecen
los datos estadísticos sin que se haya hecho ninguna modificación al tamaño de las
unidades originales. En estas distribuciones cada dato mantiene su propia identidad
después que la distribución de frecuencia se ha elaborado. En estas distribuciones los
valores de cada variable han sido solamente reagrupados, siguiendo un orden lógico con
sus respectivas frecuencias.

La tabla de frecuencias de datos no agrupados se emplea si las variables toman un número


pequeños de valores o la variable es discreta.

Tabla de frecuencia de datos agrupados

La Tabla de frecuencia de datos agrupados aquella distribución en la que los datos


estadísticos se encuentran ordenados en clases y con la frecuencia de cada clase; es decir,
los datos originales de varios valores adyacentes del conjunto se combinan para formar un
intervalo de clase.

"Ejemplo de Tabla de Frecuencia de datos agrupados"

La tabla de frecuencias agrupadas se emplea generalmente si las variables toman un


número grande de valores o la variable es continua.

En este caso se agrupan los valores en intervalos que tengan la misma amplitud
denominados clases. A cada clase se le asigna su frecuencia correspondiente.

Las clases deben ser excluyentes y exhaustivas, es decir que cada elemento de la muestra
debe pertenecer a una sola clase y a su vez, todo elemento debe pertenecer a alguna clase.

Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.
Los intervalos se forman teniendo presente que el límite inferior de una clase pertenece al
intervalo, pero el límite superior no pertenece intervalo, se cuenta en el siguiente intervalo.
No existe una regla fija de cuantos son los intervalos que se deben hacer; hay diferentes
criterios, la literatura especializada recomienda considerar entre 5 y 20 intervalos. El
número de intervalos se representa por la letra "K".

El Recorrido es el límite dentro del cual están comprendidos todos los valores de la serie
de datos. Es la diferencia entre el valor máximo de una variable y el valor mínimo que ésta
toma en una investigación cualquiera.

R = Xmax. - Xmin.

La Amplitud de la clase es la diferencia entre el límite superior e inferior de la clase y se


representarán por "Ci"

Ci = R/K

Se considerará la misma amplitud para todos los intervalos.

La Marcas de clases (Xi) representa a la variable a través de un valor. Se calcula como el


punto medio de cada clase, o bien la semi suma de la clase

La tabla de frecuencias puede representarse gráficamente en un histograma. Normalmente


en el eje vertical se coloca las frecuencias y en el horizontal los intervalos de valores.

Ejemplo:
Medidas de tendencia central

Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un
solo valor a un conjunto de valores. Representan un centro en torno al cual se encuentra
ubicado el conjunto de los datos. Las medidas de tendencia central más utilizadas
son: media, mediana y moda. Las medidas de dispersión en cambio miden el grado de
dispersión de los valores de la variable. Dicho en otros términos las medidas de dispersión
pretenden evaluar en qué medida los datos difieren entre sí. De esta forma, ambos tipos de
medidas usadas en conjunto permiten describir un conjunto de datos entregando
información acerca de su posición y su dispersión.

Los procedimientos para obtener las medidas estadísticas difieren levemente dependiendo
de la forma en que se encuentren los datos. Si los datos se encuentran ordenados en una
tabla estadística diremos que se encuentran “agrupados” y si los datos no están en una
tabla hablaremos de datos “no agrupados”.

Según este criterio, haremos primero el estudio de las medidas estadísticas para datos no
agrupados y luego para datos agrupados.

Medidas estadísticas en datos no agrupado


Medidas de tendencia central

Promedio o media
La medida de tendencia central más conocida y utilizada es la media o promedio
aritméticos. Se representa por la letra griega µ cuando se trata del promedio del universo o
población y por Ȳ (léase Y barra) cuando se trata del promedio de la muestra. Es importante
destacar que µ es una cantidad fija mientras que el promedio de la muestra es variable
puesto que diferentes muestras extraídas de la misma población tienden a tener diferentes
medias. La media se expresa en la misma unidad que los datos originales: centímetros,
horas, gramos, etc.

Si una muestra tiene cuatro observaciones: 3, 5, 2 y 2, por definición el estadígrafo será:

Estos cálculos se pueden simbolizar:

Donde Y1 es el valor de la variable en la primera observación, Y2 es el valor de la segunda


observación y así sucesivamente. En general, con “n” observaciones, Yi representa el valor
de la i-ésima observación. En este caso el promedio está dado por

De aquí se desprende la fórmula definitiva del promedio:

Desviaciones: Se define como la desviación de un dato a la diferencia entre el valor del dato
y la media:

Ejemplo de desviaciones:

Una propiedad interesante de la media aritmética es que la suma de las desviaciones es


cero.

Mediana
Otra medida de tendencia central es la mediana. La mediana es el valor de la variable que
ocupa la posición central, cuando los datos se disponen en orden de magnitud. Es decir, el
50% de las observaciones tiene valores iguales o inferiores a la mediana y el otro 50% tiene
valores iguales o superiores a la mediana.

Si el número de observaciones es par, la mediana corresponde al promedio de los dos


valores centrales. Por ejemplo, en la muestra 3, 9, 11, 15, la mediana es (9+11)/2=10.

Moda
La moda de una distribución se define como el valor de la variable que más se repite. En
un polígono de frecuencia la moda corresponde al valor de la variable que está bajo el punto
más alto del gráfico. Una muestra puede tener más de una moda.

Medidas de dispersión

Las medidas de dispersión entregan información sobre la variación de la variable.


Pretenden resumir en un solo valor la dispersión que tiene un conjunto de datos. Las
medidas de dispersión más utilizadas son: Rango de variación, Varianza, Desviación
estándar, Coeficiente de variación.

Rango de variación
Se define como la diferencia entre el mayor valor de la variable y el menor valor de la
variable.

La mejor medida de dispersión, y la más generalizada es la varianza, o su raíz cuadrada,


la desviación estándar. La varianza se representa con el símbolo σ² (sigma cuadrado) para
el universo o población y con el símbolo s2 (s cuadrado), cuando se trata de la muestra. La
desviación estándar, que es la raíz cuadrada de la varianza, se representa por σ (sigma)
cuando pertenece al universo o población y por “s”, cuando pertenece a la muestra. σ² y σ
son parámetros, constantes para una población particular; s2 y s son estadígrafos, valores
que cambian de muestra en muestra dentro de una misma población. La varianza se
expresa en unidades de variable al cuadrado y la desviación estándar simplemente en
unidades de variable.

Fórmulas
Donde µ es el promedio de la población.

Donde Ȳ es el promedio de la muestra.

Consideremos a modo de ejemplo una muestra de 4 observaciones

Según la fórmula el promedio calculado es 7, veamos ahora el cálculo de las medidas de


dispersión:

s2 = 34 / 3 = 11,33 Varianza de la muestra

La desviación estándar de la muestra (s) será la raíz cuadrada de 11,33 = 3,4.

Interpretación de la varianza (válida también para la desviación estándar): un alto valor de


la varianza indica que los datos están alejados del promedio. Es difícil hacer una
interpretación de la varianza teniendo un solo valor de ella. La situación es más clara si se
comparan las varianzas de dos muestras, por ejemplo, varianza de la muestra igual 18 y
varianza de la muestra b igual 25. En este caso diremos que los datos de la muestra b
tienen mayor dispersión que los datos de la muestra a. esto significa que en la muestra a
los datos están más cerca del promedio y en cambio en la muestra b los datos están más
alejados del promedio.

Coeficiente de variación
Es una medida de la dispersión relativa de los datos. Se define como la desviación estándar
de la muestra expresada como porcentaje de la media muestral.

Es de particular utilidad para comparar la dispersión entre variables con distintas unidades
de medida. Esto porque el coeficiente de variación, a diferencia de la desviación estándar,
es independiente de la unidad de medida de la variable de estudio.

Medidas de tendencia central y de dispersión en datos agrupados

Se identifica como datos agrupados a los datos dispuestos en una distribución de


frecuencia. En tal caso las fórmulas para el cálculo de promedio, mediana, modo, varianza
y desviación estándar deben incluir una leve modificación. A continuación, se entregan los
detalles para cada una de las medidas.

Promedio en datos agrupados


La fórmula es la siguiente:

Donde ni representa cada una de las frecuencias correspondientes a los diferentes valores
de Yi.

Consideremos como ejemplo una distribución de frecuencia de madres que asisten a un


programa de lactancia materna, clasificadas según el número de partos. Por tratarse de una
variable en escala discreta, las clases o categorías asumen sólo ciertos valores: 1, 2, 3, 4,
5.

Entonces las 42 madres han tenido, en promedio, 2,78 partos.

Si la variable de interés es de tipo continuo será necesario determinar, para cada intervalo,
un valor medio que lo represente. Este valor se llama marca de clase (Yc) y se calcula
dividiendo por 2 la suma de los límites reales del intervalo de clase. De ahí en adelante se
procede del mismo modo que en el ejercicio anterior, reemplazando, en la fórmula de
promedio, Yi por Yc.

Mediana en datos agrupados


Si la variable es de tipo discreto la mediana será el valor de la variable que corresponda a
la frecuencia acumulada que supere inmediatamente a n/2. En los datos de la tabla 1 Me=3,
ya que 42/2 es igual a 21 y la frecuencia acumulada que supera inmediatamente a 21 es
33, que corresponde a un valor de variable (Yi) igual a 3.

Si la variable es de tipo continuo es necesario, primero, identificar la frecuencia acumulada


que supere en forma inmediata a n/2, y luego aplicar la siguiente fórmula:
Donde:

Moda en datos agrupados


Si la variable es de tipo discreto la moda o modo será al valor de la variable (Yi) que tenga
la mayor frecuencia absoluta ( ). En los datos de la tabla 1 el valor de la moda es 3 ya que
este valor de variable corresponde a la mayor frecuencia absoluta =16.

Más adelante se presenta un ejemplo integrado para promedio, mediana, varianza y


desviación estándar en datos agrupados con intervalos.

Varianza en datos agrupados


Para el cálculo de varianza en datos agrupados se utiliza la fórmula

Con los datos del ejemplo y recordando que el promedio (Y) resultó ser 2,78 partos por
madre,

Cuando los datos están agrupados en intervalos de clase, se trabaja con la marca de clase
(Yc), de tal modo que la fórmula queda:

Donde Yc es el punto medio del intervalo y se llama marca de clase del intervalo

Yc= (Límite inferior del intervalo + límite superior del intervalo)/2.

Percentiles

Los percentiles son valores de la variable que dividen la distribución en 100 partes iguales.
De este modo si el percentil 80 (P80) es igual a 35 años de edad, significa que el 80% de
los casos tiene edad igual o inferior a 35 años.

Su procedimiento de cálculo es relativamente simple en datos agrupados sin intervalos.

Retomemos el ejemplo de la variable número de partos:

El percentil j (Pj) corresponde al valor de la variable (Yi ) cuya frecuencia acumulada supera
inmediatamente al “j” % de los casos (jxn/100).

El percentil 80, en los datos de la tabla, será el valor de la variable cuyo Ni sea
inmediatamente superior a 33,6 ((80x42) /100).

El primer Ni que supera a 33,6 es 39. Por lo tanto, al percentil 80 le corresponde el valor 4.
Se dice entonces que el percentil 80 es 4 partos (P80=4). Este resultado significa que un
80% de las madres estudiadas han tenido 4 partos o menos.

Si los datos están agrupados en una tabla con intervalos, el procedimiento es levemente
más complejo ya que se hace necesaria la aplicación de una fórmula.

Se aplica a los datos del intervalo cuya frecuencia acumulada ( Ni ) sea inmediatamente
superior al “j” % de los casos (jxn/100).

En la siguiente tabla se muestra la distribución de 40 familias según su ingreso mensual en


miles de pesos. Nótese que para calcular el centro de clase se usaron los límites reales de
cada intervalo.

1. El ingreso mensual promedio será:

2. La mediana será:

Esto significa que un 50% de las familias tiene ingreso mensual igual o inferior a $127.270.

3. El percentil 78 será:

Por lo tanto, se puede decir que 78% de las familias tienen ingreso igual o inferior a
$174.660.

4. Los percentiles 10 y 90 serán:

A base de los valores de los percentiles 10 y 90 se pueden hacer tres afirmaciones:

• El 10% de las familias tiene ingreso igual o inferior a $90.000.


• El 90% de las familias tiene ingreso igual o inferior a $210.000.
• El 80% central, de las familias, tiene ingreso entre $90.000 y $210.000

5. - La varianza será:

6. La desviación estándar es la raíz cuadrada de esta cifra, es decir: 43,76.

Nociones de probabilidad y muestreo

En estadística se conoce como muestreo a la técnica para la selección de una muestra a


partir de una población.

Al elegir una muestra se espera conseguir que sus propiedades sean extrapolables a la
población. Este proceso permite ahorrar recursos, y a la vez obtener resultados parecidos
a los que se alcanzarían si se realizase un estudio de toda la población.

Cabe mencionar que para que el muestreo sea válido y se pueda realizar un estudio
adecuado (que consienta no solo hacer estimaciones de la población sino estimar también
los márgenes de error correspondientes a dichas estimaciones), debe cumplir ciertos
requisitos. Nunca podremos estar enteramente seguros de que el resultado sea una
muestra representativa, pero sí podemos actuar de manera que esta condición se alcance
con una probabilidad alta.
En el muestreo, si el tamaño de la muestra es más pequeño que el tamaño de la población,
se puede extraer dos o más muestras de la misma población. Al conjunto de muestras que
se pueden obtener de la población se denomina espacio muestral. La variable que asocia
a cada muestra su probabilidad de extracción sigue la llamada distribución muestral.

El muestreo es el proceso de seleccionar un conjunto de individuos de una población


con el fin de estudiarlos y poder caracterizar el total de la población.
La idea es bastante simple. Imagina que queremos saber algo de un universo o población,
por ejemplo, qué porcentaje de los habitantes de México fuma habitualmente. Una forma
de obtener este dato sería contactar con todos los habitantes de México (122 millones de
personas) y preguntarles si fuman. La otra forma sería seleccionar un subconjunto de
individuos (por ejemplo, 1.000 personas), preguntarles si fuman y usar esta información
como una aproximación de la información buscada. Pues bien, este grupo de 1.000
personas que me permiten conocer mejor cómo se comportan el total de mexicanos es
una muestra, y la forma en que los seleccionamos es la técnica de muestreo.

En la definición anterior hemos introducido dos términos fundamentales a lo largo de esta


serie de posts:

1) Universo o población: Es el total de individuos que deseo estudiar o caracterizar. En


el ejemplo anterior, el universo lo forman los habitantes de México, pero podemos pensar
en todo tipo de universos, más generales o concretos. Por ejemplo, si quiero saber cuánto
fuman de media los fumadores de México, el universo en este caso sería "los fumadores
de México".
2) Muestra: Es el conjunto de individuos del universo que selecciono para estudiarlos, por
ejemplo, a través de una encuesta.

¿Por qué funciona el muestreo?

El muestreo es útil gracias a que podemos acompañarlo de un proceso inverso, que


llamamos generalización de resultados. Es decir, para conocer un universo lo que
hacemos es:

1) Extraer una muestra del mismo.


2) Medir un dato u opinión.
3) Proyectar en el universo el resultado observado en la muestra.

La generalización de resultados añade cierto error al dato que medimos. Imagina que
tomamos una muestra al azar de 1.000 personas de México y les preguntamos si fuman.
Obtengo que el 25% de la muestra fuma. La simple lógica nos dice que si de 1.000
mexicanos elegidos al azar el 25% fuma, este dato debería ser indicativo de lo que
obtendríamos si preguntásemos a los 122 millones de mexicanos. Ahora bien, el azar
podría haber hecho que haya escogido para mi muestra más fumadores de lo que
correspondería a la proporción exacta que hay en el universo o, por el contrario, que en mi
muestra los fumadores estén algo infrarrepresentados. El azar podría hacer que el
porcentaje de fumadores en la población fuese algo diferente del 25% que hemos
observado en la muestra (tal vez un 25,2%, por ejemplo). Por lo tanto, la generalización de
resultados de un muestra a un universo conlleva aceptar que cometemos cierto error, tal y
como ilustra el siguiente esquema.

Afortunadamente, el error cometido al generalizar resultados puede acotarse gracias a la


estadística. Para ello suelen usarse dos parámetros: el margen de error, que es la máxima
diferencia que esperamos que haya entre el dato observado en mi muestra y el dato real
en el universo, y el nivel de confianza, que es el nivel de certeza que tenemos de que el
dato real esté dentro del margen de error.
Por ejemplo, en nuestro caso de fumadores mexicanos, si selecciono una muestra de 471
individuos y les pregunto si fuman, el resultado que obtenga tendrá un margen de error
máximo de ±5% con un nivel de confianza del 97%. Esta forma de expresar los resultados
es la correcta cuando usamos muestreo.

El tamaño de la muestra:

¿Qué tamaño de muestra necesito usar para estudiar cierto universo? Depende del tamaño
del universo y del nivel de error que esté dispuesto a aceptar, tal y como explicábamos en
su día en este post. Cuanta más precisión exija, mayor muestra necesito. Si quiero tener
una certeza absoluta en mi resultado, hasta el último decimal, mi muestra tendrá que ser
tan grande como mi universo.

Pero el tamaño de la muestra tiene una propiedad fundamental que explica por qué el
muestreo se usa tanto en tantos ámbitos del conocimiento. Esta propiedad podría resumirse
como sigue: a medida que estudio universos mayores, el tamaño de muestra que necesito
cada vez representa un porcentaje menor de dicho universo.

Este fenómeno lo explican de forma muy didáctica en Gaussianos.com, un interesante blog


dedicado a las matemáticas. Supongamos que queremos hacer una encuesta para conocer
un porcentaje (podría ser el de gente que fuma) con un nivel de error determinado, por
ejemplo, un margen de error del 5% y una confianza del 95%. Si el universo a estudiar fuese
de tan sólo 100 personas, mi muestra tendría que ser de 79,5 individuos (es decir, 79,5%
del universo, lo que representa un parte muy importante del total del universo). Si el
universo fuese de 1.000 personas, mi muestra debería ser de 277,7 personas (27,7% del
universo). Y si mi universo fuese de 100.000 personas, la muestra necesaria sería de 382,7
personas (3,83% del universo).

Por lo tanto, a medida que trabajo con universos más grandes, la muestra que necesito
debe ir creciendo, pero de forma no proporcional, tiende a estancarse y cada vez representa
un porcentaje más pequeño del universo. A partir de cierto tamaño de universo (en torno a
100.000 individuos), el tamaño de la muestra ya no necesita crecer más. La siguiente tabla
nos muestra algunos ejemplos:
Tamaño de muestra necesaria para tener un error del 5% con un nivel de confianza
del 95%

Universo Muestra necesaria %

10 10 100%

100 80 80%

1.000 278 27,8%

10.000 370 3,7%

100.000 383 0,38%

1.000.000 384 0,038%

10.000.000 385 0,004%

100.000.000 385 0,0004%

Los datos anteriores nos dicen que por grande que sea el universo, con 385 personas puedo
estudiar cualquier dato con el mismo nivel de error (margen de 5%, confianza de 95%). Por
esta razón el muestreo es tan poderoso: nos permite hacer afirmaciones altamente precisas
de una gran cantidad de individuos a través de un parte muy pequeña de los mismo.

Como contrapartida, el ejemplo anterior ilustra que el muestreo no funciona bien en


universos pequeños. Si tengo una clase de 10 alumnos, la opinión de cada uno de ellos es
fundamental para conocer la opinión global, no puedo prescindir de ninguno. Si no quiero
superar el error que nos hemos propuesto, en un universo de 10 individuos necesito
encuestar a todos ellos.

También podría gustarte