Wuolah Free Apuntes Datos 1 Tema 1 y 2
Wuolah Free Apuntes Datos 1 Tema 1 y 2
Wuolah Free Apuntes Datos 1 Tema 1 y 2
www.wuolah.com/student/C_Cruz2
3378
Apuntes-Datos-1-tema-1-y-2.pdf
Apuntes Datos1
Grado en Psicología
Facultad de Psicología
Universidad de Sevilla
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su
totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2939680
INTRODUCCIÓN
El análisis de datos es un conjunto de técnicas analíticas, que sirven para comparar grupos y relacionar
variables así como para detectar posibles diferencias y relaciones.
“Conjunto de procedimientos diseñados para resumir y organizar datos con el objetivo de extraer
información y elaborar conclusiones” (Prado, Ruiz y San Martín, 2009, p. 17)
2. Niveles de indagación:
a. Descriptivo (cómo son las cosas)
b. Relacional (cómo unas cosas se relacionan con otras
c. Explicativo ( por qué las cosas son como son)
3. Tipo de conclusiones
El análisis de datos se basa en datos. Para poder analizarlos es necesario asignar números a las
caracteristicas que se desea estudiar. Dependiendo del tipo de relaciones que se establezca entre los
valores (números) asignados a una característica, se establecen diferentes niveles de medida.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2939680
Los datos brutos se extrapolan a una tabla de frecuencias. Esta tabla nos sirve para trabajar con esos datos.
Si es estable una escala con una variable cualitativa (cada número se relaciona con cada uno de los valores de una
variable), los números utilizados expresan sólo identidad y nada más. En estos casos, el 10 no es mayor que
el 7, sólo indica una diferencia entre esos datos recogidos.
TABULACIÓN:
TABLA O DISTRIBUCIÓN DE FRECUENCIAS Forma particular de ordenar los datos basada en los valores concretos que
adopta una variable categórica y en el número de veces que se repite cada valor Objetivo: organizar y resumir la
información
Se organizan los datos de forma que resulte más sencillo conocer a situación sin tener que acudir a los datos
iniciales. Para esto se utiliza la tabla de frecuencias (número de veces que se repite un valor)
Frecuencia absoluta: se llama frecuencia absoluta de un valor Xi, y se simboliza por fi, al número de veces
que se repite dicho valor en la muestra
Frecuencia relativa o proporción: se llama frecuencia elativa de un valor Xi, y se simboliza por pi, al cociente
entre la frecuencia absoluta de ese valor y el tamaño de la muestra
Xi = Valor de i en la variable X. Fi = Frecuencia del valor i. N= Registro de frecuencia (Fi =20; N=20)
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2939680
REPRESENTACIÓN NUMÉRICA:
Para las variables cualitativas, la medida de representación será la Moda (Mo) y la medida de bondad de
la representación (BMo) será el porcentaje
Moda (Mo): Valor de una variable con mayor frecuencia. Este valor sólo representa a los sujetos que
perteneces a esa moda, pero es errónea con respecto al resto de valores. Aun así es el valor que menos
errores genera.
Índice de bondad de ajuste: Es un recurso que acompaña a una representación y que expresa cuán buena
es para representar al conjunto total de los datos. (Porcentaje)
MATIZACIONES:
En variables cualitativas dicotómicas o con pocos valores, no tiene sentido usar una representación
numérica, es más lógico usar una tala o gráfica.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2939680
Con una cantidad demasiado grande de datos para una variable, se recodifican los valores creando
categorías nuevas que surgen de la unión de las frecuencias de otras, reduciendo así las categorías o valores
de la variable. (Impensable un diagrama con más de 7 barras o una Mo con valores infinitesimales por su baja credibilidad y
mala interpretación)
En una variable ordinal, se establece un cierto orden entre sus valores, con intervalo inexacto entre ellos,
por lo que podemos decir que 10 es mayor que 6, pero no cuánto
Ciertos procesos de medida más elaborados permiten tratar algunas variables ordinales como si fueran
cuantitativas. Ejemplo: encuestas sobre ideología política con procedimientos muy comprobados y
aplicados a muestras muy grandes. Cuando una variable ordinal llega a un nivel alto de medida se considera
como cuasicuantitativa, lo que nos permite trabajar con ella como si fuese cuantitativa y facilitar el trabajo.
Limitaciones:
En ocasiones interesa recodificar datos e incluir dos variables muy similares (x1 malísimo y x2 muy malo, se
pueden agrupar/unificar bajo el concepto “opinión negativa)
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2939680
REPRESENTACIÒN GRÁFICA
REPRESENTACIÓN NUMÉRICA
Utilizaremos como medida de representación la MEDIANA (MD). Esta representa un valor de todos los
ofrecidos y evitaría que algunos datos fuesen ignorados.
Para calcular:
SIEMPRE que se utiliza el ÍNDICE DE REPRESENTACIÓN, hay que usar la medida de BONDAD DE LA
REPRESENTACIÓN.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2939680
Para medir la bondad de la mediana, utilizaremos la Mediana de distancias a la mediana o MAD. Cuanto
mayor sea la distancia, más error tendrá la mediana a estudiar. Se considera representativa Md si MAD no
supera el 50% del valor de esta.
INTERPRETACIÓN:
Conforme mayor sea el valor de MAD, peor será Md para representar al conjunto de datos.
No hay una norma para considerar si el valor de MAD es tolerable o excesivo, pero hay guías:
o Si MAD no supera el 50% de Md, Md es una buena representación numérica
o Si MAD=Md, la dispersión es muy elevada y Md no es una buena medida
o Entre 50% y 100%, vamos usar sentido común. Por ejemplo, valorando la teoría o
acudiendo a otras medidas
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2939680
Su representación gráfica son los histogramas (diagrama de barras con agrupación de valores y sin espacios
intermedios)
DIAGRAMA DE CAJAS:
3º Todo dato con un valor fuera de ese rango es outlier y por tanto objeto
de ser revisado de nuevo en nuestros datos iniciales
en busca de algún error
REPRESENTACIÓN NUMÉRICA:
MEDIA ARITMÉTICA
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2939680
el valor que deja a ambos lados la misma cuantía. (Similar a una báscula):
Ejemplo:
La media aritmética minimiza la suma de errores cuadráticos. Sirve para repartir “peso” de los datos en
cantidades iguales a dos mitades, buscando equilibrio
EJEMPLO GRÁFICO:
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2939680
MATIZACIONES
Los valores tienen sentido cuando se encuadran en un rango determinado. Con el coeficiente de Pearson,
se elimina la unidad de medida y se expresan los datos siempre en %. Sirve para hacer cualquier tipo de
estudio.
Ejercicios introductorios:
http://asignatura.us.es/dadpsico/apuntes/EjConocerUnaVariable.pdf
https://www.superprof.es/apuntes/escolar/matematicas/estadistica/descriptiva/ejercicios-y-problemas-
de-estadistica-i.html
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.