Álgebra y 3. Manejo de La Información Estadística Temario Comipems
Álgebra y 3. Manejo de La Información Estadística Temario Comipems
Álgebra y 3. Manejo de La Información Estadística Temario Comipems
Álgebra
Curso Matemáticas, ingreso al bachillerato.
Monomios:
Estas expresiones algebraicas son del tipo axn en donde a representa un número
real que se denomina coeficiente, y x es una indeterminada, es decir un elemento
no conocido al que llamaremos parte literal.
Ejemplo de Monomios:
, 3x2, 2a.
En donde: 3, 2 son coeficientes
POLINOMIOS
Es una expresión algebraica que consta de más de un término. Se expresan de la
forma.
a+b, a+x-y, x3 +2x2+x+7
Los polinomios se clasifican en.
Binomios: Es decir un polinomio que tiene dos términos
Ejemplo:
a+b, x-y,
Trinomios:
Son polinomios que contienen tres términos
Ejemplos:
a+b+c, x2-5x+6, 5x2-6y+a2
RESTA
La resta, diferencia o sustracción es la operación binaria que tiene por objetivo hallar
el sumando desconocido
Otra definición dice que la resta es la operación inversa de la suma o también que
es una operación de comparación, en la que se establece la diferencia entre dos
polinomios, o bien lo que le falta a un polinomio para llegar a ser igual al otro. . Y
hay quienes van a afirmar que la resta es el resultado de sumar a un polinomio dado
llamado minuendo, el inverso aditivo de otro polinomio que en tal caso se llamará
sustraendo.
Ecuación 1
Resolver:
Solución
Resolución de problemas con expresiones algebraicas.
Ejemplo:
Encontrar el número que cumple que la suma de su doble y
de su triple es igual a 100.
Resolviendo la ecuación:
4x – 3y = 5
2x + 7y = 6
• Método de sustitución.
• Método de igualación.
• Método de reducción.
En todos ellos hay que operar previamente con las ecuaciones con vistas a
simplificarlas.
Criterios de equivalencia
Ejemplo:
Dada la ecuación: 3x -2 = 4x + 7
Ejemplo:
Dada la ecuación: 3x -2 = 4x + 7
Ejemplo:
Dada la ecuación: 3x -2 = 4x + 7
Ejemplo:
Dada la ecuación: 3x -2 = 4x + 7
3x -2 = 4x + 7
2x – 5 = x
3x -2 + 2x – 5 = 4x + 7 + x
2x – 5 = x
3x -2 = 4x + 7
2x – 5 = x
3x -2 + (2x – 5) * 5 = 4x + 7 + (x) * 5
3x -2 + 10x – 25 = 4x + 7 + 5x
2x – 5 = x
Ejemplo:
Encontrar dos números cuya suma sea 45 y cuya resta sea 21.
ución
El sistema de ecuaciones es
Resolver:
Son aquellos productos que se rigen por reglas fijas y cuyo resultado puede hallarse
por simple inspección. Su denominados también "Identidades Algebraicas". Son
aquellos productos cuyo desarrollo es clásico y por esto se le reconoce fácilmente. Las
más importantes son :
( a + b )2 = a2 + 2ab + b2
( a - b )2 = a2 - 2ab + b2
( a + b ) ( a - b ) = a2 - b2
Producto de dos binomios que tienen un término común: El cuadrado del término
común, más el producto de termino común por la suma de los términos no comunes,
más el producto de los términos no comunes.
( x + a)(x + b) = x2 + ( a + b) x + ab
Binomio Suma al Cubo: El Cubo del Primer Término, más el triple producto del
cuadrado del primer por el segundo Término, más el triple producto del primer por el
cuadrado del segundo Término, más el cubo del segundo Término.
( a + b )3 = a3 + 3 a2b + 3 ab2 + b3 = a3 + b3 + 3 ab (a + b)
Binomio Diferencia al Cubo El Cubo del Primer Término, menos el triple producto del
cuadrado del primer por el segundo Término, más el triple producto del primer por el
cuadrado del segundo Término, menos el cubo del segundo Término.
( a - b )3 = a3 - 3 a2b + 3 ab2 - b3
Suma de dos Cubos: Se saca raíz cubica a cada uno de los dos términos cúbicos,
para obtener un binomio (la suma de dos números), y en base a ese binomio, se utiliza
la siguiente regla para obtener un trinomio: el cuadrado del primero, menos el producto
del primero por el segundo, más el cuadrado del segundo.
a3 + b3 = ( a + b ) ( a2 – ab + b2)
Diferencia de Cubos Se saca raíz cubica a cada uno de los dos términos cúbicos, para
obtener un binomio (la diferencia de dos números), y en base a ese binomio, se utiliza
la siguiente regla para obtener un trinomio: el cuadrado del primero, más el producto
del primero por el segundo, más el cuadrado del segundo.
a3 - b3 = ( a - b ) ( a2 + ab + b2)
Identidades de Legendre
( a + b)2 + ( a – b)2 = 4 ab
Resumen:
Son ecuaciones de segundo grado aquellas en las que la incógnita aparece al menos una
vez elevada al cuadrado (x2 ). Por ejemplo: 3x2 - 3x = x - 1.
Pasemos al primer miembro de la ecuación todos los términos de forma que en el segundo
miembro quede 0. Obtenemos:
6x2 - 3x = x - 2x + 4 + 2x2
ax2 +bx + c = 0
donde a, b y c serán números enteros (positivos o negativos). Para ello bastará obtener el
denominador común (si hay denominadores), para eliminarlo y pasar todos los términos al
primer miembro.
Sabemos que una vez conseguida dicha forma, las dos "posibles" soluciones de la ecuación
son:
"Si la parábola corta al eje X en dos puntos, los valores de x en esos puntos son la dos
soluciones o raíces de la ecuación de segundo grado"
Recordatorio
Por comodidad, resolveremos la ecuación de tres formas distintas según los valores de los
coeficientes b y c.
Se llama discriminante, Δ, a
Caso 1
Si b, c≠0, se dice que la ecuación es completa y sus soluciones las proporciona la fórmula
Caso 2
Caso 4
La única solución es
Resolver:
Por ejemplo:
Ejemplo: un obrero tarda 10 horas en levantar un muro, 18 horas en levantar dos, y 24 horas
en levantar tres.
La relación entre dos magnitudes también puede ser inversamente proporcional, es decir,
que cuando una de las magnitudes aumenta en una proporción, la otra disminuye en la
misma proporción.
Por ejemplo: Un agricultor tarda 4 días en arar una finca, mientras que 2 agricultores tardan
8 días.
En este ejemplo, mientras que el número de agricultores se ha multiplicado por 2, los días
necesarios para realizar esta labor han quedado divididos por la misma magnitud.
1x4=4
Esa proporción de mantiene constante en los distintos valores que pueden tomar ambas
magnitudes.
2x2=4
Relaciones de proporcionalidad en el plano cartesiano
Mediante el uso de las gráficas se pueden interpretar y explicar situaciones
diversas, por ejemplo:
• El crecimiento de la población en determinada región del país en un
periodo de tiempo.
• La variación del peso de un bebé a lo largo de cierto periodo de
tiempo.
• El índice de natalidad en un país a través del tiempo.
En la secuencia 7, “Cómo es y dónde está la población”, de su libro
de Geografía de México y el mundo estudiaron la distribución de la población
en México. La siguiente es una gráfica que muestra el crecimiento de la
población de nuestro país en los últimos 8 años.
Para localizar e interpretar los puntos de una gráfica se hace uso de sus
coordenadas. Las coordenadas del punto A son (2004,104), esto quiere decir
que en el año 2004 había 104 millones de habitantes. En la primera coordenada
del punto, llamada abscisa, van los años, y en la segunda coordenada del punto,
llamada ordenada, el número de habitantes que hubo en ese año. El
punto A tiene como abscisa a 2004 y como ordenada a 104.
De acuerdo con la información de la gráfica, respondan lo siguiente:
a) ¿En qué año había 102 millones de habitantes?__________________
De forma similar, si los datos son singulares en número, entonces se realiza el análisis de
datos estadísticos univariado. Esto incluye la prueba t para significancia, prueba z, prueba
f, ANOVA, etc.
Hay varias fdp y fmp en el análisis de datos estadísticos. Por ejemplo, la distribución de
Poisson es la fmp comúnmente conocida, y la distribución normal es la fdp comúnmente
conocida.
Media
La media aritmética, más comúnmente conocida como "el promedio", es la suma de una
lista de números dividida por el número de elementos en la lista.
Sin embargo, en un conjunto de datos con un alto número de valores atípicos o una
distribución sesgada, el promedio simplemente no proporciona la precisión que necesita
para una decisión.
Desviación estándar
Una desviación estándar alta significa que los datos se distribuyen más ampliamente desde
la media, donde una baja desviación estándar indica que más datos se alinean con la media.
Dentro de los métodos de análisis de datos, la desviación estándar es útil para determinar
rápidamente la dispersión de puntos de datos.
Problemas
Al igual que la media, la desviación estándar es engañosa si se toma sola. Por ejemplo, si
los datos tienen un patrón muy extraño, como una curva no normal o una gran cantidad de
valores atípicos, la desviación estándar no le dará toda la información que necesita.
Regresión
La naturaleza de una línea de regresión, sin embargo, lo tienta a ignorar estos valores
atípicos.
Tamaño de la muestra
Al medir un gran conjunto de datos o población, como una fuerza de trabajo, no siempre es
necesario recopilar información de cada miembro de esa población: una muestra puede ser
suficiente. El truco es determinar el tamaño correcto para que una muestra sea precisa.
Pruebas de Hipótesis
Las pruebas de Hipótesis se utilizan en todo, desde la ciencia y la investigación hasta los
negocios y la economía.
Problemas
Para ser riguroso, las pruebas de Hipótesis deben tener en cuenta los errores comunes.
Por ejemplo, el efecto placebo ocurre cuando los participantes esperan falsamente un
determinado resultado y luego perciben (o realmente alcanzan) ese resultado.
Otro error común es el efecto Hawthorne (o efecto observador), que ocurre cuando los
participantes sesgan los resultados porque saben que están siendo estudiados.
Tablas de frecuencia absoluta y relativa
Las Tablas de frecuencias son herramientas de Estadística donde se colocan los
datos en columnas representando los distintos valores recogidos en la muestra y
las frecuencias (las veces) en que ocurren.
Datos
Frecuencia absoluta
N1 = n1
N2 = n1 + n2 = N1 + n2
N3 = n1 + n2 + n3 = N2 + n3
Nk = n.
Frecuencia relativa
fi = ni/n
F1 = fl
F2 = f1+ f2 = F1 + f2
F3 = f1+ f2 + f3 = F2 + f3
Fk = 1
Los datos no agrupados son las de observaciones realizadas en un estudio estadístico que
se presentan en su forma original tal y como fueron recolectados, para obtener información
directamente de ellos.
La Tabla de frecuencia de datos no agrupados indica las frecuencias con que aparecen
los datos estadísticos sin que se haya hecho ninguna modificación al tamaño de las
unidades originales. En estas distribuciones cada dato mantiene su propia identidad
después que la distribución de frecuencia se ha elaborado. En estas distribuciones los
valores de cada variable han sido solamente reagrupados, siguiendo un orden lógico con
sus respectivas frecuencias.
En este caso se agrupan los valores en intervalos que tengan la misma amplitud
denominados clases. A cada clase se le asigna su frecuencia correspondiente.
Las clases deben ser excluyentes y exhaustivas, es decir que cada elemento de la muestra
debe pertenecer a una sola clase y a su vez, todo elemento debe pertenecer a alguna clase.
Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.
Los intervalos se forman teniendo presente que el límite inferior de una clase pertenece al
intervalo, pero el límite superior no pertenece intervalo, se cuenta en el siguiente intervalo.
No existe una regla fija de cuantos son los intervalos que se deben hacer; hay diferentes
criterios, la literatura especializada recomienda considerar entre 5 y 20 intervalos. El
número de intervalos se representa por la letra "K".
El Recorrido es el límite dentro del cual están comprendidos todos los valores de la serie
de datos. Es la diferencia entre el valor máximo de una variable y el valor mínimo que ésta
toma en una investigación cualquiera.
R = Xmax. - Xmin.
Ci = R/K
Ejemplo:
Medidas de tendencia central
Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un
solo valor a un conjunto de valores. Representan un centro en torno al cual se encuentra
ubicado el conjunto de los datos. Las medidas de tendencia central más utilizadas
son: media, mediana y moda. Las medidas de dispersión en cambio miden el grado de
dispersión de los valores de la variable. Dicho en otros términos las medidas de dispersión
pretenden evaluar en qué medida los datos difieren entre sí. De esta forma, ambos tipos de
medidas usadas en conjunto permiten describir un conjunto de datos entregando
información acerca de su posición y su dispersión.
Los procedimientos para obtener las medidas estadísticas difieren levemente dependiendo
de la forma en que se encuentren los datos. Si los datos se encuentran ordenados en una
tabla estadística diremos que se encuentran “agrupados” y si los datos no están en una
tabla hablaremos de datos “no agrupados”.
Según este criterio, haremos primero el estudio de las medidas estadísticas para datos no
agrupados y luego para datos agrupados.
Promedio o media
La medida de tendencia central más conocida y utilizada es la media o promedio
aritméticos. Se representa por la letra griega µ cuando se trata del promedio del universo o
población y por Ȳ (léase Y barra) cuando se trata del promedio de la muestra. Es importante
destacar que µ es una cantidad fija mientras que el promedio de la muestra es variable
puesto que diferentes muestras extraídas de la misma población tienden a tener diferentes
medias. La media se expresa en la misma unidad que los datos originales: centímetros,
horas, gramos, etc.
Desviaciones: Se define como la desviación de un dato a la diferencia entre el valor del dato
y la media:
Ejemplo de desviaciones:
Mediana
Otra medida de tendencia central es la mediana. La mediana es el valor de la variable que
ocupa la posición central, cuando los datos se disponen en orden de magnitud. Es decir, el
50% de las observaciones tiene valores iguales o inferiores a la mediana y el otro 50% tiene
valores iguales o superiores a la mediana.
Moda
La moda de una distribución se define como el valor de la variable que más se repite. En
un polígono de frecuencia la moda corresponde al valor de la variable que está bajo el punto
más alto del gráfico. Una muestra puede tener más de una moda.
Medidas de dispersión
Rango de variación
Se define como la diferencia entre el mayor valor de la variable y el menor valor de la
variable.
Fórmulas
Donde µ es el promedio de la población.
Coeficiente de variación
Es una medida de la dispersión relativa de los datos. Se define como la desviación estándar
de la muestra expresada como porcentaje de la media muestral.
Es de particular utilidad para comparar la dispersión entre variables con distintas unidades
de medida. Esto porque el coeficiente de variación, a diferencia de la desviación estándar,
es independiente de la unidad de medida de la variable de estudio.
Donde ni representa cada una de las frecuencias correspondientes a los diferentes valores
de Yi.
Si la variable de interés es de tipo continuo será necesario determinar, para cada intervalo,
un valor medio que lo represente. Este valor se llama marca de clase (Yc) y se calcula
dividiendo por 2 la suma de los límites reales del intervalo de clase. De ahí en adelante se
procede del mismo modo que en el ejercicio anterior, reemplazando, en la fórmula de
promedio, Yi por Yc.
Con los datos del ejemplo y recordando que el promedio (Y) resultó ser 2,78 partos por
madre,
Cuando los datos están agrupados en intervalos de clase, se trabaja con la marca de clase
(Yc), de tal modo que la fórmula queda:
Donde Yc es el punto medio del intervalo y se llama marca de clase del intervalo
Percentiles
Los percentiles son valores de la variable que dividen la distribución en 100 partes iguales.
De este modo si el percentil 80 (P80) es igual a 35 años de edad, significa que el 80% de
los casos tiene edad igual o inferior a 35 años.
El percentil j (Pj) corresponde al valor de la variable (Yi ) cuya frecuencia acumulada supera
inmediatamente al “j” % de los casos (jxn/100).
El percentil 80, en los datos de la tabla, será el valor de la variable cuyo Ni sea
inmediatamente superior a 33,6 ((80x42) /100).
El primer Ni que supera a 33,6 es 39. Por lo tanto, al percentil 80 le corresponde el valor 4.
Se dice entonces que el percentil 80 es 4 partos (P80=4). Este resultado significa que un
80% de las madres estudiadas han tenido 4 partos o menos.
Si los datos están agrupados en una tabla con intervalos, el procedimiento es levemente
más complejo ya que se hace necesaria la aplicación de una fórmula.
Se aplica a los datos del intervalo cuya frecuencia acumulada ( Ni ) sea inmediatamente
superior al “j” % de los casos (jxn/100).
2. La mediana será:
Esto significa que un 50% de las familias tiene ingreso mensual igual o inferior a $127.270.
3. El percentil 78 será:
Por lo tanto, se puede decir que 78% de las familias tienen ingreso igual o inferior a
$174.660.
5. - La varianza será:
Al elegir una muestra se espera conseguir que sus propiedades sean extrapolables a la
población. Este proceso permite ahorrar recursos, y a la vez obtener resultados parecidos
a los que se alcanzarían si se realizase un estudio de toda la población.
Cabe mencionar que para que el muestreo sea válido y se pueda realizar un estudio
adecuado (que consienta no solo hacer estimaciones de la población sino estimar también
los márgenes de error correspondientes a dichas estimaciones), debe cumplir ciertos
requisitos. Nunca podremos estar enteramente seguros de que el resultado sea una
muestra representativa, pero sí podemos actuar de manera que esta condición se alcance
con una probabilidad alta.
En el muestreo, si el tamaño de la muestra es más pequeño que el tamaño de la población,
se puede extraer dos o más muestras de la misma población. Al conjunto de muestras que
se pueden obtener de la población se denomina espacio muestral. La variable que asocia
a cada muestra su probabilidad de extracción sigue la llamada distribución muestral.
La generalización de resultados añade cierto error al dato que medimos. Imagina que
tomamos una muestra al azar de 1.000 personas de México y les preguntamos si fuman.
Obtengo que el 25% de la muestra fuma. La simple lógica nos dice que si de 1.000
mexicanos elegidos al azar el 25% fuma, este dato debería ser indicativo de lo que
obtendríamos si preguntásemos a los 122 millones de mexicanos. Ahora bien, el azar
podría haber hecho que haya escogido para mi muestra más fumadores de lo que
correspondería a la proporción exacta que hay en el universo o, por el contrario, que en mi
muestra los fumadores estén algo infrarrepresentados. El azar podría hacer que el
porcentaje de fumadores en la población fuese algo diferente del 25% que hemos
observado en la muestra (tal vez un 25,2%, por ejemplo). Por lo tanto, la generalización de
resultados de un muestra a un universo conlleva aceptar que cometemos cierto error, tal y
como ilustra el siguiente esquema.
El tamaño de la muestra:
¿Qué tamaño de muestra necesito usar para estudiar cierto universo? Depende del tamaño
del universo y del nivel de error que esté dispuesto a aceptar, tal y como explicábamos en
su día en este post. Cuanta más precisión exija, mayor muestra necesito. Si quiero tener
una certeza absoluta en mi resultado, hasta el último decimal, mi muestra tendrá que ser
tan grande como mi universo.
Pero el tamaño de la muestra tiene una propiedad fundamental que explica por qué el
muestreo se usa tanto en tantos ámbitos del conocimiento. Esta propiedad podría resumirse
como sigue: a medida que estudio universos mayores, el tamaño de muestra que necesito
cada vez representa un porcentaje menor de dicho universo.
Por lo tanto, a medida que trabajo con universos más grandes, la muestra que necesito
debe ir creciendo, pero de forma no proporcional, tiende a estancarse y cada vez representa
un porcentaje más pequeño del universo. A partir de cierto tamaño de universo (en torno a
100.000 individuos), el tamaño de la muestra ya no necesita crecer más. La siguiente tabla
nos muestra algunos ejemplos:
Tamaño de muestra necesaria para tener un error del 5% con un nivel de confianza
del 95%
10 10 100%
100 80 80%
Los datos anteriores nos dicen que por grande que sea el universo, con 385 personas puedo
estudiar cualquier dato con el mismo nivel de error (margen de 5%, confianza de 95%). Por
esta razón el muestreo es tan poderoso: nos permite hacer afirmaciones altamente precisas
de una gran cantidad de individuos a través de un parte muy pequeña de los mismo.