Guia Didactica - GD
Guia Didactica - GD
Guia Didactica - GD
Estadística en Tecnologías de la
Información
Guía didáctica
MAD-UTPL
Facultad de Ingenierías y Arquitectura
Guía didáctica
Autora:
MAD-UTPL
Universidad Técnica Particular de Loja
Reconocimiento-NoComercial-CompartirIgual
4.0 Internacional (CC BY-NC-SA 4.0)
Usted acepta y acuerda estar obligado por los términos y condiciones de esta Licencia, por lo que, si existe el
incumplimiento de algunas de estas condiciones, no se autoriza el uso de ningún contenido.
Los contenidos de este trabajo están sujetos a una licencia internacional Creative Commons
Reconocimiento-NoComercial-CompartirIgual 4.0 (CC BY-NC-SA 4.0). Usted es libre de Compartir —
copiar y redistribuir el material en cualquier medio o formato. Adaptar — remezclar, transformar y construir
a partir del material citando la fuente, bajo los siguientes términos: Reconocimiento- debe dar crédito de
manera adecuada, brindar un enlace a la licencia, e indicar si se han realizado cambios. Puede hacerlo
en cualquier forma razonable, pero no de forma tal que sugiera que usted o su uso tienen el apoyo de la
licenciante. No Comercial-no puede hacer uso del material con propósitos comerciales. Compartir igual-Si
remezcla, transforma o crea a partir del material, debe distribuir su contribución bajo la misma licencia del
original. No puede aplicar términos legales ni medidas tecnológicas que restrinjan legalmente a otras a
hacer cualquier uso permitido por la licencia. https://creativecommons.org/licenses/by-nc-sa/4.0/
20 de septiembre, 2021
MAD-UTPL
Índice Índice
1. Datos de información................................................................................ 7
1.1. Presentación de la asignatura.......................................................... 7
1.2. Competencias genéricas de la UTPL............................................... 7
1.3. Competencias específicas de la carrera......................................... 7
1.4. Problemática que aborda la asignatura........................................... 7
2. Metodología de aprendizaje...................................................................... 8
3. Orientaciones didácticas por resultados de aprendizaje............................ 9
Primer bimestre............................................................................................ 9
Resultado de aprendizaje 1.................................................................................... 9
Contenidos, recursos y actividades de aprendizaje............................................. 9
Semana 1 ..................................................................................................... 9
Semana 2 ..................................................................................................... 12
1.3. Probabilidades...................................................................................... 12
1.4. Probabilidad condicional..................................................................... 13
Actividad de aprendizaje recomendada................................................................ 14
Autoevaluación 1.................................................................................................... 15
Semana 3 ..................................................................................................... 17
Semana 4 ..................................................................................................... 19
4 MAD-UTPL
Autoevaluación 2.................................................................................................... 24
Índice
Resultado de aprendizaje 2.................................................................................... 26
Contenidos, recursos y actividades de aprendizaje............................................. 26
Semana 5 ..................................................................................................... 26
Semana 6 ..................................................................................................... 32
Semana 7 ..................................................................................................... 37
Semana 8 ..................................................................................................... 37
Segundo bimestre......................................................................................... 38
Resultado de aprendizaje 3.................................................................................... 38
Contenidos, recursos y actividades de aprendizaje............................................. 38
Semana 9 ..................................................................................................... 38
Semana 10 ................................................................................................... 43
4.3. Regresión.............................................................................................. 43
5 MAD-UTPL
Actividad de aprendizaje recomendada................................................................ 47
Índice
Autoevaluación 4.................................................................................................... 48
Resultado de aprendizaje 4.................................................................................... 50
Contenidos, recursos y actividades de aprendizaje............................................. 50
Semana 11 ................................................................................................... 50
Semana 12 ................................................................................................... 53
Semana 13 ................................................................................................... 59
Semana 14 ................................................................................................... 62
Semana 15 ................................................................................................... 66
Semana 16 ................................................................................................... 66
4. Solucionario............................................................................................. 67
5. Referencias bibliográficas........................................................................ 73
6 MAD-UTPL
1. Datos de información
7 MAD-UTPL
Así como transmitir los resultados de la aplicación de estas técnicas usando
un lenguaje estadístico.
2. Metodología de aprendizaje
8 MAD-UTPL
3. Orientaciones didácticas por resultados de aprendizaje 1 Bimestre
Primer bimestre
Semana 1
9 MAD-UTPL
1.1. Modelo determinístico
Ejemplo:
Veamos otro caso: y=2x, al igual que en el ejemplo anterior las variables se
relacionan de forma determinística, ya que dado un valor para una variable el
valor de la otra se determina de manera exacta sin errores.
10 MAD-UTPL
Ahora lo invito a revisar otros ejemplos de problemas que pueden ser
resueltos con modelos determinísticos:
Ahora veamos en el ámbito informático que se podría realizar con este tipo
de modelos. Bien, se puede aplicar un modelo estocástico para predecir el
rendimiento de un sistema informático, para predecir el tráfico de una red,
para el análisis de redes sociales, etc.
11 MAD-UTPL
Después de la lectura del tema 1.1 y 1.2 usted está en la capacidad de
identificar a un modelo determinístico de uno estocástico (probabilístico).
Para ello, le invito a revisar el recurso web Economía de la Empresa,
específicamente el punto 3, modelos de gestión de stock.
1 Bimestre
Semana 2
1.3. Probabilidades
Como parte del estudio de este tema, es necesario que profundice en dos
componentes desarrollados en el capítulo 4 de su texto básico, estos son:
1) Conceptos básicos de probabilidad, 2) Regla de la suma y regla de la
multiplicación.
12 MAD-UTPL
Una vez realizada la lectura de este tema lo invito a revisar el siguiente
ejercicio de probabilidad, que le permitirá poner en práctica los conceptos de
probabilidad.
Ejercicio: 1 Bimestre
Solución:
Dividir la cantidad de celulares que son marca Samsung (68) por la cantidad
total de celulares almacenados en bodega (87).
Como usted habrá observado hay una probabilidad del 78,16%, de que el
celular escogido al azar sea marca Samsung.
Como pudo darse cuenta en su texto básico para que se trate de una
probabilidad condicionada necesariamente se debe suponer la ocurrencia
de otro evento, siendo de esta manera su notación P(B|A), la cual se lee la
13 MAD-UTPL
probabilidad de B dado A, es decir, la probabilidad de que el evento B ocurra
dada la ocurrencia del evento A.
Luego de las lecturas realizadas sobre los temas tratados en esta unidad,
usted está en la capacidad de dar respuesta a las siguientes interrogantes: 1 Bimestre
¿Cómo le fue con las respuestas a las interrogantes?, estoy segura de que
estas preguntas le permitirán fortalecer lo aprendido en esta unidad.
14 MAD-UTPL
Autoevaluación 1
1 Bimestre
Seleccione la alternativa correcta en cada uno de los siguientes enunciados.
2. En un modelo estocástico:
5. La notación P (A o B) indica:
15 MAD-UTPL
6. Cuando la probabilidad de un evento es afectada por el conocimiento
de que algún otro evento ha ocurrido, entonces se habla de:
a. Probabilidad complementaria.
b. Probabilidad condicional. 1 Bimestre
c. Probabilidad disjunta.
a. P(B y A)
b. P(B). P(A)
c. P(B|A)
a. Probabilidad de M dado A.
b. Probabilidad de A dado M.
c. Probabilidad de A y M.
16 MAD-UTPL
Semana 3
Bien, como podrá haberse dado cuenta las variables aleatorias pueden ser
discretas o continuas. Algunos ejemplos de ellas se ilustran en el siguiente
recurso interactivo:
Por tanto, del estudio de este tema es conveniente que tenga claro cómo
se representa una distribución de probabilidad, los parámetros de una
distribución de probabilidad discreta, la definición de valor esperado y
cuando el valor de una variable aleatoria es significativamente alto o bajo.
17 MAD-UTPL
2.2. Distribuciones de probabilidad de Bernoulli
Cómo usted conoce a menudo en la vida real nos encontramos con eventos
que solo tienen dos resultados, por ejemplo, en el caso de un nuevo
1 Bimestre
emprendimiento tendríamos: éxito o fracaso, en el caso de un examen:
aprueba o reprueba, operatividad de un sistema: funciona o falla, etc. En
estas situaciones podemos aplicar el concepto de probabilidad de Bernoulli
o ensayos de Bernoulli.
18 MAD-UTPL
éxito o fracaso. Además, tanto la probabilidad de éxito o fracaso no cambian
de un ensayo a otro.
Semana 4 1 Bimestre
Ejemplo:
19 MAD-UTPL
Si observa en la función de probabilidad de Bernoulli no se incluye (n x).
20 MAD-UTPL
Tenga en cuenta además, que usted puede calcular la probabilidad binomial
usando el método 2, por ejemplo Excel, seleccionando la función estadística
“DISTR.BINOM.N”, al ingresar los parámetros correspondientes obtendrá el
mismo resultado. Lo invito a hacer el ensayo.
1 Bimestre
21 MAD-UTPL
Algunos ejemplos en los que se puede emplear esta distribución a parte de
los mencionados en su texto básico son:
Bien, ahora que ya conoce de que trata esta distribución lo invito a revisar el
siguiente ejercicio:
Ejercicio:
Parámetro μ=0.1
Variable x=2
Recuerde que puede comprobar los resultados con el uso de tecnología por
ejemplo Excel mediante la función POISSON.
22 MAD-UTPL
En resumen, tener presente que este tipo de distribución es
aplicable cuando queremos modelar situaciones en las que
nos interesa determinar la probabilidad de que ocurra un
determinado número de eventos durante un intervalo de tiempo o
espacio. Analicemos este planteamiento realizando la siguiente 1 Bimestre
actividad recomendada.
23 MAD-UTPL
Autoevaluación 2
1 Bimestre
Seleccione la alternativa correcta en cada uno de los siguientes enunciados.
a. Parámetros.
b. Variables aleatorias discretas.
c. Significancia estadística.
a. Varios ensayos.
b. Un solo ensayo.
c. Ningún ensayo.
24 MAD-UTPL
6. Para encontrar las probabilidades binomiales, es posible:
a. Distribución de Gauss.
b. Distribución de Poisson.
c. Distribución Multinomial.
a. Distribución de Bernoulli.
b. Distribución Binomial.
c. Distribución de Poisson.
a. La media y la varianza.
b. Únicamente la media.
c. La media, desviación estándar y varianza.
25 MAD-UTPL
Dada una situación de ejemplo, formular una
Resultado de hipótesis nula apropiada para una pregunta simple
aprendizaje 2 y realizar una prueba apropiada para determinar su
aceptabilidad. 1 Bimestre
Semana 5
26 MAD-UTPL
¿Qué es una hipótesis y una prueba de hipótesis?
¿Cuál es la diferencia entre una hipótesis nula y una alterna?
¿Cuáles son los pasos que se siguen para realizar una prueba de
hipótesis?
¿A qué hace referencia en nivel de significancia? 1 Bimestre
Figura 1.
Ejemplo de hipótesis nula y alterna
H0: H1:
27 MAD-UTPL
Siguiendo los pasos señalados en su texto básico puede dar una
representación simbólica de la afirmación representada en la figura anterior.
Lo invito a realizarlo considerando el ejemplo 1 de los conceptos básicos de
las pruebas de hipótesis.
1 Bimestre
Una vez que haya completado la lectura de los pasos para realizar una
prueba de hipótesis, lo invito a conocer a qué se refiere el Error tipo I y tipo II.
Ejemplo:
H0: p=0.5
H1: p>0.5
28 MAD-UTPL
La afirmación que describe el Error tipo I y tipo II sería:
29 MAD-UTPL
3.2. Prueba de hipótesis respecto a una proporción
Una vez que conoce los pasos para realizar una prueba de hipótesis, es
necesario revisar como se prueba una hipótesis sobre una proporción
1 Bimestre
poblacional p. Para tratar este tema lo invito a realizar una lectura de su
texto básico, sección “Prueba de una hipótesis respecto a una proporción”.
Ejercicio:
30 MAD-UTPL
Bien, a diferencia del ejercicio descrito anteriormente, también
se puede utilizar las pruebas de hipótesis en la medición del
desempeño de diferentes tipos de software; para probar la
utilidad de programas de ordenador para el desarrollo de un
proyecto; para analizar encuestas aplicadas a una proporción 1 Bimestre
de consumidores de productos tecnológicos antes de lanzar al
mercado un nuevo producto, etc.
Para resolver esta actividad puede basarse en los elementos claves para
una prueba de hipótesis.
31 MAD-UTPL
Semana 6
Con la lectura de esta sección usted conocerá como realizar una prueba
de hipótesis acerca de la media poblacional con desviación estándar
desconocida y conocida. Revise los ejemplos desarrollados y los métodos
equivalentes para la prueba de t-student que conducen a las mismas
conclusiones.
Una vez comprendido el tema, realice otra lectura de la sección 8-4 Prueba
de una hipótesis respecto a una desviación estándar o varianza. ¿Cuál es
el dato estadístico de prueba utilizado en este caso? Supongo que pudo
observar que el estadístico de prueba utilizado es X2 (ji-cuadrada o chi-
cuadrada) y que este posee algunas propiedades. Bien, ahora veamos
como se aplica analizando los ejemplos presentados en la sección
correspondiente a este tema en su texto básico.
Además de los ejemplos del texto base, usted puede aplicar las prueba de
hipótesis respecto a una media poblacional, por ejemplo para: probar la
incidencia de las redes sociales en el estilo de vida de las personas; probar
32 MAD-UTPL
afirmaciones relacionadas con la velocidad de transferencia de datos, uso
de una red social mediante la aplicación de encuestas a usuarios de Internet,
etc.
Tabla 1.
Estadísticos de prueba para diferentes pruebas de hipótesis
Como usted se habrá dado cuenta existen algunos requisitos que se deben
cumplir para aplicar cada tipo de prueba de hipótesis. En la tabla 8-2 de su
texto básico puede revisar un resumen de los requisitos que debe cumplir
cada tipo de prueba a realizar.
33 MAD-UTPL
Autoevaluación 3
1 Bimestre
Seleccione la alternativa correcta en cada uno de los siguientes enunciados.
a. Pruebas de significación.
b. Hipótesis nula.
c. Intervalo de confianza.
34 MAD-UTPL
5. El método que permite probar una hipótesis, tomando una decisión al
comparar el estadístico de prueba con el (los) valor(es) crítico(s), se
conoce como:
a. Error tipo I.
b. Error tipo II.
c. Error tipo III.
a. ji cuadrada.
b. t Student.
c. Normal.
a. Prueba t.
b. Prueba z.
c. Prueba X^2.
35 MAD-UTPL
10. El dato estadístico de prueba para probar una hipótesis sobre una
proporción es:
1 Bimestre
a.
b.
c.
36 MAD-UTPL
Actividades finales del bimestre
1 Bimestre
Semana 7
Una vez completado el estudio de las unidades del primer bimestre lo invito
a desarrollar la siguiente actividad, la cual le permitirá poner en práctica los
conocimientos aprendidos y entrenarse para la evaluación presencial.
Semana 8
37 MAD-UTPL
Segundo bimestre
Usted tendrá una visión clara de cómo determinar la correlación entre 2 Bimestre
Semana 9
4.1. Correlación
38 MAD-UTPL
Veamos el siguiente ejemplo:
Ejemplo
Tabla 2.
Tiempo en minutos del número de páginas impresas
Nota: Tabla que muestra los resultados del uso de una impresora en una oficina de
informática.
39 MAD-UTPL
Figura 2.
Diagrama de dispersión del uso del tiempo transcurrido de sucesivos usos de
la impresora y el número de páginas impresas. Correlación positiva r=0.802
14
12
Num. páginas impresas
10 2 Bimestre
0
0 1 2 3 4 5 6 7 8 9 10
Tiempo
Nota: Imagen obtenida usando la herramienta R, con la función plot().
Al analizar la gráfica se puede observar que hay una relación entre las
variables. Para calcular el valor de correlación se puede utilizar algunas de
las herramientas tecnológicas mencionadas en el texto básico e ingresar
los valores que se muestran en la tabla anterior. Además, en la siguiente
sección se presenta cómo calcular el valor del coeficiente de correlación r
mediante el uso de una fórmula.
40 MAD-UTPL
Figura 3.
Fuerza de la correlación
41 MAD-UTPL
Figura 4.
Tipo de correlación con base en el valor del coeficiente de correlación
Positiva 0≤r≤1
Correlación 2 Bimestre
Negativa -1 ≤ r < 0
Nota: En base al valor del coeficiente de correlación se conoce si ésta es positiva o
negativa.
42 MAD-UTPL
Semana 10
4.3. Regresión
Figura 5.
Variables del modelo de regresión simple
Explica
Y Relación
X
Dependiente Independiente o explicativa
Nota. Rodríguez (2007).
43 MAD-UTPL
Además, usted podrá haberse dado cuenta que la forma de obtener estas
rectas es mediante el método de los mínimos cuadrados. Para enfatizar en
este procedimiento matemático voy a resaltar lo expresado por Rodríguez
(2007), quién menciona que para construir una recta de regresión “se trata
de colocar una recta entre los puntos dados, de la forma mejor balanceada
con el criterio de hacer que la suma de las distancias de la recta a los puntos
sea la menor posible” (p. 273). De esta forma a esta recta también se la
conoce como recta de mínimos cuadrados. 2 Bimestre
44 MAD-UTPL
Figura 6.
Claves para identificar una regresión lineal.
Una vez realizada la lectura, asumo que usted ya tiene clara la diferencia
entre el modelo de regresión simple y múltiple, ya que en el primero
se predice el valor de la variable dependiente a partir de una variable
explicativa, mientras que, en el modelo de regresión lineal múltiple se
genera una ecuación (modelo) que basándose en la relación existente entre
variables, permita predecir el valor de la variable dependiente a partir de dos
o más variables explicativas, como se representa a continuación:
45 MAD-UTPL
Figura 7.
Variables del modelo de regresión lineal múltiple
Explica
Y Relación
X1 X2 ... Xn
Dependiente Independientes o explicativas
2 Bimestre
Nota: El modelo de regresión lineal múltiple está formado de una variable
dependiente y dos o más variables independientes.
Regresión
46 MAD-UTPL
Por ejemplo, si deseamos predecir el rendimiento de un sistema y tenemos
como variable respuesta (dependiente) una variable cualitativa, llamada
rendimiento con valores: ALTO o BAJO, en este caso lo más aplicable es un
modelo de regresión logística.
47 MAD-UTPL
Autoevaluación 4
a. -1≤r<0
b. 0≤r≤1
c. r=0
48 MAD-UTPL
6. En la ecuación de la recta el valor del estadístico b0, hace referencia a:
a. Es cercano a 0.
b. Es cercano a 1.
c. Es igual a 1.
49 MAD-UTPL
Resultado de Realiza un análisis estadístico del rendimiento de
aprendizaje 5 un sistema.
Semana 11
50 MAD-UTPL
Capítulo 12: Análisis de varianza, sección “ANOVA de un factor”, y revise los
conceptos básicos de este tipo de prueba, la distribución que se requiere
para realizar una prueba ANOVA, los requisitos a cumplir, y los cálculos e
identificación de medias que son diferentes.
Figura 8.
Contraste de hipótesis. ANOVA de un factor
Ejemplo:
51 MAD-UTPL
las mediciones obtenidas en tiempo de ejecución después de que cada uno
de ellos fue ejecutado en diferente computador.
Tabla 3.
Tiempo de ejecución de cada programa
2 Bimestre
Ejercicio:
Verifique la hipótesis de que las medias del tiempo de ejecución son iguales
utilizando el nivel de significación 0.05. Puede seguir los siguientes pasos:
52 MAD-UTPL
Recuerde también que puede utilizar la herramienta Statdisk
o cualquier otra herramienta de las mencionadas en su texto
básico para obtener los resultados ANOVA.
2 Bimestre
Semana 12
¿Animado para continuar adelante con el siguiente tema? Seguro que sí.
Ahora revisaremos el método de análisis de varianza con dos factores. Para
ello, es necesario revisar los conceptos claves que se requieren para aplicar
este método, desarrollando una lectura comprensiva de la sección “ANOVA
de dos factores” de su texto básico. En esta sección usted encontrará
algunas definiciones importantes a tener en cuenta de este método, el
procedimiento a seguir para el ANOVA de dos factores, y algunos ejemplos
en los que se detalla paso a paso como realizar esta prueba estadística.
53 MAD-UTPL
Figura 9.
Anova de dos factores
2 Bimestre
ANOVA
54 MAD-UTPL
Ahora considerando su campo de estudio completemos el siguiente
ejercicio:
Si contamos con una tabla que registra los tiempos de ejecución de algunos
algoritmos, donde el tiempo se ve afectado por el tipo de lenguaje de
programación y el sistema operativo en el que se ejecutan, ¿cuáles serían
los factores a considerar? Puede completar este ejercicio colocando valores
al azar o utilizar algoritmos desarrollados por usted mismo y ejecutarlos 2 Bimestre
55 MAD-UTPL
Con el desarrollo de esta actividad usted podrá recordar los conceptos
analizados en esta sección dando respuesta a las interrogantes que se
plantean en cada uno de estos ejercicios.
56 MAD-UTPL
Autoevaluación 5
57 MAD-UTPL
6. En el ANOVA de dos factores al utilizar “gráficos de interacción”, si los
segmentos de líneas son aproximadamente paralelas significa que:
a. Aproximadamente normal.
b. Binomial.
c. Categórica.
a. ANOVA de un factor.
b. ANOVA de dos factores.
c. ANOVA de tres factores.
58 MAD-UTPL
Resultado de Determina si una prueba paramétrica o no
aprendizaje 6 paramétrica es apropiada.
Semana 13
59 MAD-UTPL
importantes a tener en cuenta al momento de elegir una prueba paramétrica
o no paramétrica.
Tabla 4.
Cuadro comparativo de las pruebas paramétricas y no paramétricas
En la tabla anterior usted podrá observar que antes de aplicar una prueba
paramétrica o no paramétrica, es importante conocer el tamaño de la
muestra poblacional y la escala en la que están medidos los datos.
Recuerde que las pruebas no paramétricas pueden ser utilizadas con datos
categóricos y que no presentan una distribución normal. Por tanto, este tipo
de pruebas pueden ser aplicadas a una variedad de situaciones donde sea
necesario contrastar una hipótesis y se requiera analizar datos en escala
nominal (categóricos). Por ejemplo: En una muestra de usuarios de telefonía
móvil donde es necesario emplear el género para probar una hipótesis de
que existe diferencia entre el uso del celular por parte de los hombres y el
uso del celular en las mujeres.
60 MAD-UTPL
Ejemplo prueba del signo
Bien, hasta ahora hemos visto la aplicación de la prueba del signo para
datos numéricos, pero ¿qué sucede con aquellas afirmaciones en las cuales
tenemos datos nominales o categóricos? Revisemos el texto básico sección
“Afirmaciones que implican datos nominales con dos categorías” y veamos
cómo usar la prueba del signo.
61 MAD-UTPL
Actividad de aprendizaje recomendada
Semana 14
Tabla 5.
Usos de la prueba de rangos con signo de Wilcoxson
Afirmaciones que involucran Una población de datos pareados posee la propiedad de que
datos pareados los pares relacionados tienen diferencias con una mediana
igual a cero.
Afirmaciones sobre la Una sola población de valores individuales tiene algún valor
mediana de una sola declarado de la mediana.
población
62 MAD-UTPL
desarrollo de ejemplos, en los cuales se aplican algunos pasos a seguir
hasta llegar a la conclusión de aceptar o no la hipótesis nula.
63 MAD-UTPL
Autoevaluación 6
64 MAD-UTPL
6. En afirmaciones sobre pares relacionados es importante tener en
cuenta que:
de signos negativos.
a. Paramétrica.
b. No paramétricas.
c. Paramétrica y no paramétrica.
65 MAD-UTPL
Actividades finales del bimestre
Semana 15
2 Bimestre
Una vez completado el estudio de las unidades del segundo bimestre lo
invito a desarrollar la siguiente actividad, que le permitirá poner en práctica
los conocimientos aprendidos y entrenarse para la evaluación presencial.
Semana 16
66 MAD-UTPL
4. Solucionario
Autoevaluación 1
67 MAD-UTPL
Autoevaluación 2
68 MAD-UTPL
Autoevaluación 3
69 MAD-UTPL
Autoevaluación 4
70 MAD-UTPL
Autoevaluación 5
71 MAD-UTPL
Autoevaluación 6
72 MAD-UTPL
5. Referencias bibliográficas
73 MAD-UTPL