Tema 1 Estadistica Descriptiva

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 14

ESCUELA UNIVERSITARIA DE ENFERMERIA DE TERUEL

1er CURSO DE GRADO DE ENFERMERIA


“Estadística en Ciencias de la Salud”

1. ESTADISTICA DESCRIPTIVA

PROFESOR

Dr. Santiago Valdearcos Enguídanos


Escuela Universitaria de Enfermería de Teruel. 1er Curso de Grado. 2
_______________________________________________________________________________________

1.- Introducción

En el siglo XVIII cuando ya había aparecido la metodología científica


inductiva (utilizada en nuestros días), algunos matemáticos ilustres desarrollaron
los fundamentos de la teoría de probabilidades, incitados en parte por los
grandes jugadores de los casinos.

Esta teoría permitía predecir eventos o sucesos influidos por el azar o la


variabilidad. El empeño de la ciencia de todos los tiempos ha sido (y sigue
siendo) reducir al máximo lo azaroso en sus experimentos, esto es la
“casualidad” o simplemente, lo que desconocemos. En ese momento se
descubrió una forma de razonar o método que, teniendo en cuenta la presencia
del azar, pretendía ofrecer la posibilidad de competir con él, e incluso
dominarlo.
A partir de la teoría de probabilidades se desarrolló la Estadística, ciencia
que aplica un método de razonamiento lógico-matemático y que estudia los
aspectos de la realidad en los que interviene el azar.
Las Ciencias de la Salud se incluyen dentro del ámbito de la biología, en el
que la variabilidad de los hechos es la regla.

La Estadística es un método de razonamiento para describir e


interpretar información, cuya característica principal es la variabilidad de los
datos.
En el medio sanitario es muy adecuada porque permite el manejo de la
variabilidad biológica.

Método científico Método estadístico

Observación de un hecho Observación e identificación de un


problema de salud: Estadistica descriptiva

Formulación de hipótesis Formulación de hipótesis

Verificación de hipótesis: Verificación de hipótesis:


Experimentación Estadística analítica e inferencial

_____________________________________________________________________________________________________________
Asignatura: ESTADISTICA EN CIENCIAS DE LA SALUD
Tema 1.- Estadística Descriptiva 3

Comparación de grupos Comparación de grupos

Pruebas de hipótesis
Control de errores
Interpretación de
resultados
Interpretación de resultados

Ley general Generalización


Teoría o conocimientos actuales

Estadística descriptiva:

Es el método que resume o describe un conjunto de observaciones.

Ejemplo: Media de edad de una clase de alumnos, proporción de mujeres en un


lugar de trabajo, representación gráfica de un conjunto de datos, o la expresión
cotidiana:
“Juan recorre un promedio (o media) de 100 Km a la semana”

Estadística inferencial o analítica:

Utiliza las observaciones descritas, por medio de la estadística


descriptiva, para predecir, inferir o estimar una situación que no ha ocurrido
todavía.

Ejemplo: “Podemos esperar mucha lluvia en esta época del año”,


“Podemos esperar que haya muchos casos de gripe en invierno”

2.- Conceptos Básicos

1.- Concepto de Variable

El concepto de “variable” se refiere a la característica que deseamos


medir en un grupo de individuos (edad, sexo, presencia de enfermedad, muerte,
peso, hábitos alimenticios, etc.). Permite distinguir a unos individuos de otros.

2.-Escalas de medida de las variables

Asignatura: METODOLOGIA DE INVESTIGACION


Escuela Universitaria de Enfermería de Teruel. 1er Curso de Grado. 4
_______________________________________________________________________________________

Medir es asignar valores a las variables del estudio. Su principal función es


evitar la subjetividad del investigador.
La forma de medir las variables va a determinar el análisis matemático,
estadístico, de las mismas.
Existen varias escalas de medida:

1.- Cualitativas:

Miden una característica, en término de cualidad, nunca de forma


numérica.
Cada uno de los valores que puede tomar la variable se llama categorías.
Deben incluir todas las opciones posibles que puede adoptar la variable.
Pueden ser:
- Escala nominal: Determina la igualdad o desigualdad de los individuos.
Sexo: masculino o femenino. Fumador: Sí. No.
Estado Civil: soltero, casado, viudo, separado o divorciado.
- Escala ordinal: Determina el orden de los individuos de “mayor”,
“menor” o “igual que”.
Consumo de Tabaco: no fumador, fumador moderado, fumador
importante.
Consumo de tabaco: Tabaco : 0 c/d, 1-10 c/d, > 10 c/d
Escala de dolor

Si las variables cualitativas tienen solo dos categorías se llama variable


cualitativa dicotómica (Ejemplo: Sexo: Hombre. Mujer), y si tiene más de dos,
variable cualitativa politómica (color de cabello: negro, rubio, castaño,
pelirrojo)

2.- Cuantitativas:
Miden una característica de forma numérica. Pueden ser:
- Discretas o discontinuas: Entre dos valores consecutivos no existe otro
valor.
Ejemplo; Número de hijos. Número de ingresos hospitalarios.
- Continuas: Entre dos valores consecutivos se pueden encontrar infinitos
valores.
Ejemplo: Peso, glucemia , etc.

3.- Recogida y tabulación de datos

Tabulación es la operación de resumir de forma ordenada un conjunto de datos


numéricos en una tabla.

Tabla de frecuencias: Tabla en la que se expresa de manera ordenada un


conjunto de observaciones con el nº de veces que se repiten.

_____________________________________________________________________________________________________________
Asignatura: ESTADISTICA EN CIENCIAS DE LA SALUD
Tema 1.- Estadística Descriptiva 5

Se pueden construir tablas de frecuencia para cualquier tipo de variable


cualitativa o cuantitativa.

TABLA DE FRECUENCIAS
Columna Fila

Tabla de frecuencias de la distribución de edad de 6 personas. Datos no


agrupados. Variable: EDAD
Edad Frecuencia Frecuencia Frecuencia Frecuencia
Absoluta (n) Relativa (f) % absoluta Relativa
acumulada (na) acumulada
(F)
1 año 2 0,33 33% 2 0,33
2 años 1 0,17 17% 3 0,50
3 años 3 0,50 50% 6 1
6 (N) 1 100%

Tabla de frecuencias de la distribución de edad en 23 personas. Datos


agrupados. Variable: EDAD
Intervalos Punto Frecuencia Frecuencia Frecuencia Frecuencia
de edad medio Absoluta Relativa % absoluta Relativa
Del (n) (f) acumulada acumulada
intervalo (na) (F)
1-5 3 5 0,21 21% 5 0,21
6-10 8 10 0,43 43% 15 0,65
11-15 13 8 0,34 34% 23 1
23 (N) 1 100%

Intervalos de la variable:

Cuando el número de observaciones o de datos es muy grande se


recomienda su agrupación en intervalos, es aplicable a las variables
cuantitativas.
El punto medio del intervalo es el valor promedio o centro de gravedad
del intervalo. En la práctica se calcula sumando el límite inferior y el superior y
dividiéndolo por 2.

Frecuencia absoluta (n):


Nº de veces que ocurre un determinado valor de una variable

Frecuencia relativa (p, f) o proporción:

Asignatura: METODOLOGIA DE INVESTIGACION


Escuela Universitaria de Enfermería de Teruel. 1er Curso de Grado. 6
_______________________________________________________________________________________

Resultado de dividir la frecuencia absoluta (n) por el nº total de individuos


estudiados (N) f = n/N

Frecuencia absoluta acumulada (na):


Sumatorio, (∑)de las frecuencias absolutas.

Frecuencia relativa acumulada (F):


Resultado de dividir la frecuencia absoluta acumulada por el nº total de
individuos estudiados (N). F = na/N. Como % se llama percentil.

4.- Representación gráfica de la información

Cuando se quiere describir de forma clara y resumida la información


recogida sobre una variable a estudio en una determinada población o grupo de
personas se recurre a la “imagen” o a la representación gráfica.

Tipos de representación gráfica:

1.-Diagrama de barras

Es adecuado para representar variables cualitativas y variables


cuantitativas discretas.
Sobre un eje de coordenadas, el eje de abcisas recoge los valores
asignados a la variable, y el eje de ordenadas la frecuencia absoluta o relativa.
La escala siempre comienza en 0, coincidiendo con el punto de origen de las
coordenadas.

Tipo de escuela n f (%)


Rural 19 37,3
Urbana 24 47,0
Suburbial 8 15,7
Total 51 100,0

Tipos de escuelas

30
25
20
15
10
5
0
Rural Urbana Suburbial

2.-Diagrama de sectores

_____________________________________________________________________________________________________________
Asignatura: ESTADISTICA EN CIENCIAS DE LA SALUD
Tema 1.- Estadística Descriptiva 7

Se representan mediante un círculo. Cada valor de la variable representa


una porción del círculo y se ajustan proporcionalmente a la frecuencia de
aparición de los valores de la variable, mediante una regla de tres. Con los datos
del ejemplo anterior

Escuelas Escuelas
Suburbial
16% 8
Rural
37% 19

Rural Rural
Urbana Urbana
Suburbial Suburbial
Urbana 24
47%

3.-Histograma y polígono de frecuencias

Es apropiado para variables cuantitativas continuas. Sobre un eje de


coordenadas, en el eje de abscisas se colocan los valores de la variable de forma
continua, y en el eje de ordenadas la frecuencia con que se repiten esos valores.
El histograma se puede completar con el polígono de frecuencias. Para
construirlo se precisa la construcción previa del histograma.
Se van uniendo con una línea los puntos medios en los lados superiores de
los rectángulos que forman el histograma.
Glucosa en mg/dl

60
<60
40 60-80

20 81-100
101-120
0
>120
1

Glucosa en mg/dl

60
50 <60
40 60-80
30
20 81-100
10 101-120
0 >120
1

5.- Medidas Estadísticas

Asignatura: METODOLOGIA DE INVESTIGACION


Escuela Universitaria de Enfermería de Teruel. 1er Curso de Grado. 8
_______________________________________________________________________________________

Después de ordenar y reducir los datos recogidos en una tabla de


frecuencias, debe resumirse la información contenida en ella.
Este resumen de los datos en forma de números permite caracterizar una
serie de datos de forma sencilla y concisa, así como compararlos con otra serie
de datos.
Los fenómenos estudiados en Ciencias de la Salud se definen por su
variabilidad por lo que se resumen con dos tipos de medidas: las de tendencia
central, y las de dispersión o variabilidad.

Medidas de tendencia central

Son valores que reflejan el centramiento o punto central de la variable


estudiada. Son tres: la media, la mediana y la moda.

1.- Media aritmética

Es el valor promedio de todos los valores de la variable, o el “centro de


gravedad” de la distribución de datos. Se representa como “µ” si se trata de la
media de la población de referencia y como “x” si se trata de una media
muestral.
La media puede calcularse en las variables cuantitativas continuas y
discretas. La fórmula es:

∑xi ∑xi= Sumatorio de todos los valores de la variable


×= ----- N = número total de todos los individuos
N

Ejemplo :
Calcular la media de edad de un grupo de 6 personas, cuyas edades son
5,6,7,8,9 y 10 años.

X= 5+6+7+ 8+ 9+ 10 = 7,5
6

2.- Mediana

La mediana es un valor de la variable que deja a su izquierda y a su


derecha exactamente la mitad de los valores de la serie. Es la medida que divide
a la serie de datos u observaciones en dos mitades o “partes” iguales.

Para calcular este estadístico deben estar ordenados los valores de la


variable. Si la serie es impar la mediana será el valor central, y si es par, se
calcula por la suma de los dos valores centrales, dividida por 2.
Ejemplo:
Calcular la mediana de edad de la serie anterior: 5,6,7,8,9,10
Es una serie par (6 elementos) los valores centrales son 7 y 8.
_____________________________________________________________________________________________________________
Asignatura: ESTADISTICA EN CIENCIAS DE LA SALUD
Tema 1.- Estadística Descriptiva 9

Mediana = (7+8) /2= 15/2= 7,5


Calcular la mediana de edad de la serie de datos de 5 personas: 12,23,45,87,88.
Es una serie impar (5). El valor central es 45. Mediana = 45 años.

3.- Moda

Es el valor de la variable que más veces se repite en la serie de datos, el


que tiene mayor frecuencia absoluta. Se puede calcular para cualquier tipo de
variable.
Ejemplo:
Distribución de valores de una variable cuantitativa: 4,8,7,8,2,4,8,5,9,4
Hay dos modas: 4 y 8.

Medidas de dispersión o variabilidad

Son valores que reflejan la variabilidad, dispersión o fluctuación del


fenómeno o variable estudiados.
Las principales son: amplitud o rango, varianza y desviación típica o
desviación estándar.

1.- Amplitud o rango


Es la distancia entre los valores extremos de la serie. Se utiliza para
variables cuantitativas.
Se calcula por la diferencia entre el valor más alto de la serie y el valor
más bajo:
Rango = xn-x1

Ejemplo:
Calcular el rango de edad de un grupo de 6 personas, cuyas edades son 5,6,7, 8,
9 y 10 años
Rango = 10-5 = 5 años

2.- Varianza
Junto con la desviación típica es la medida que mejor expresa la
variabilidad del fenómeno observado en un grupo de personas.
Se representa como σ2 si se refiere a la varianza de la población de
referencia o s2 si se refiere a una muestra.
∑(xi- µ)2
σ 2= --------------
N

xi = cada uno de los valores de la variable


µ = meia muestral o poblacional

(xi- µ) = es la dispersión entre un valor de la variable y la media aritmética. La


suma de todas las dispersiones de todos los valores con la media podría dar un
valor 0. Para evitarlo, la expresión (xi- µ), se eleva al cuadrado, (xi- µ)2

Asignatura: METODOLOGIA DE INVESTIGACION


Escuela Universitaria de Enfermería de Teruel. 1er Curso de Grado. 10
_______________________________________________________________________________________

N = número total de sujetos del grupo o población.

Si se calcula la varianza de una muestra de sujetos:


∑(xi- x)2
s 2= ---------------
N

Ejemplo:
Calcular la varianza de un grupo de 6 personas, cuyas edades son 5,6,7, 8, 9 y 10
años.

La media de la serie = 7,5

(5-7,5)2+ (6-7,5)2+ (7-7,5)2+ (8-7,5)2+ (9-7,5)2 + (10-7,5)2


S2= --------------------------------------------------------------------------=2,91 años2
6

En otra serie de 6 personas cuyas edades son 2,5,6,10,12,12 años, calcular la


varianza
La media aritmética = 7,8

(2-7,8)2+ (5-7,8)2+ (6-7,8)2+ (10-7,8)2+ (12-7,8)2 + (12-7,8)2


S2= ----------------------------------------------------------------------------=14,14 años2
6

3.- Desviación típica ó desviación estándar

Es la raíz cuadrada de la varianza. Se representa como σ si se refiere a la


población de referencia o “s” si se refiere a una muestra.
Se expresa como σ= √σ 2
Las unidades de medida son las de la variable.
En los ejemplos anteriores del cálculo de la varianza:
Ejercicio primero S = √ 2,91 = 1,7 años
Ejercicio segundo S = √ 14,14 = 3,7 años
En el primero la serie de datos están más cerca de la media (7,5 años ) hay
menos dispersión o variabilidad que en el segundo ejercicio.

4.- Coeficiente de variación (CV)

Es una medida de dispersión relativa de los datos y se calcula dividiendo la


desviación típica muestral por la media y multiplicando el cociente por 100. Su
utilidad estriba en que nos permite comparar la dispersión o variabilidad de
dos o más grupos.

_____________________________________________________________________________________________________________
Asignatura: ESTADISTICA EN CIENCIAS DE LA SALUD
Tema 1.- Estadística Descriptiva 11

Así, por ejemplo, si tenemos el peso de 5 pacientes (70, 60, 56, 83 y 79 Kg)
cuya media es de 69,6 kg. y su desviación típica (s) = 10,44 y la TAS de los
mismos (150, 170, 135, 180 y 195 mmHg) cuya media es de 166 mmHg y su
desviación típica de 21,3. La pregunta sería: ¿qué distribución es más dispersa,
el peso o la tensión arterial?

Si comparamos las desviaciones típicas observamos que la desviación típica


de la tensión arterial es mucho mayor; sin embargo, no podemos comparar dos
variables que tienen escalas de medidas diferentes, por lo que calculamos los
coeficientes de variación:

CV de la variable peso =

CV de la variable TAS =

A la vista de los resultados, observamos que la variable peso tiene mayor


dispersión.

Medidas de posición

En la práctica se conocen como percentiles. Son valores de la variable por


detrás de los cuales se encuentra un determinado número de sujetos.
Si nos referimos al percentil 50 estamos dando un valor de la variable que deja
por debajo de sí al 50% de todos los sujetos de la serie y por encima al otro 50%.
Coincide con el valor de la mediana.
Si nos referimos al percentil 90 estamos dando un valor a la variable que
deja por encima de ese valor al 90% de las personas y a un 10% por debajo de
ese valor.

Ejemplo:
En la distribución de tallas de recién nacidos diremos que a la talla de 49 cm le
corresponde un percentil 10 (significa que un 10% de niños tiene esa talla o
menos, y un 90% tiene una talla superior). Se deduce que esa talla es baja para
un recién nacido.

Cálculo de percentiles (método de Haverage):


Supongamos la distribución de los pesos de 10 personas ordenadas de menor a
mayor

Peso(Kg) (x) Posición ( j )


Nº personas

5 1 1
Asignatura: METODOLOGIA DE INVESTIGACION
Escuela Universitaria de Enfermería de Teruel. 1er Curso de Grado. 12
_______________________________________________________________________________________

7 1 2
12 1 3
24 1 4
45 1 5
47 1 6
54 1 7
60 1 8
78 1 9
98 1 10
10 (n)

r(n+1) 50(10+1)
j =------------- = --------------= 5,5
100 100
j = posición que ocupa el percentil de rango r
r= rango del percentil que se quiere calcular (5, 10, 50, 95, etc)
n = nº de personas de la muestra

Para calcular el valor x de la variable que corresponde a la posición j:


pr = xi + ( j-i)(x i+1 – xi)
pr = valor del percentil de rango r (10, 50, 90, etc)
i = posición anterior a j
xi= valor de la variable anterior a la posición j
x i+1 = valor de la variable posterior a la posición j
p50 = 45+(5,5-5)(47-45) = 46 Kg

6. Probabilidad
5.- Medidas Estadísticas

En lenguaje común utilizamos la palabra probabilidad con bastante


frecuencia.
Decimos que un fenómeno es aleatorio cuando no se puede predecir el
resultado que se va a obtener. En biología la mayoría de los sucesos son
fenómenos aleatorios.
Si hablamos de la probabilidad de sacar “cara” al lanzar una moneda al
aire, podemos entender que tenemos un 50% de probabilidad de sacar cara, ya
que de dos sucesos posibles (cara y cruz) esperamos que salga un suceso
favorable (cara).

Definición de probabilidad: Ley de Laplace.

Probabilidad de un suceso (P) es el cociente entre sucesos favorables y sucesos


posibles.

_____________________________________________________________________________________________________________
Asignatura: ESTADISTICA EN CIENCIAS DE LA SALUD
Tema 1.- Estadística Descriptiva 13

Sucesos favorables (SF)


P = ---------------------------------
Sucesos posibles (SP)

Ejemplo anterior: P(cara) = 1/ 2 = 0,5


Probabilidad de sacar un 1 al tirar un dado P (1) = 1/6 = 0,16

Se aplica cuando se produce el principio de equiprobabilidad o


indiferencia: todos los sucesos tienen la misma probabilidad de salir.

Propiedades de este concepto de probabilidad:

- Cuando no existen sucesos favorables (suceso imposible) la probabilidad


será 0.
Ejemplo: probabilidad de sacar un 7 al tirar un dado P(7) = 0/6 = 0
- Si los sucesos favorables son todos los posibles (suceso seguro) la
probabilidad será 1.
Ejemplo: Sacar cara con una moneda trucada (moneda con dos caras)
P(cara) = 2/2 = 1
- Los valores de la probabilidad como la proporción oscila siempre entre 0 y 1

- la suma de probabilidades de todos los sucesos posibles siempre será 1.


Ejemplo:
Probabilidad de todos los sucesos posibles de determinar el sexo, en un grupo de
10 personas: 4 hombres y 6 mujeres.
P(hombre) = 4/10 = 0,4
P(mujer) = 6/10 = 0,6
P(sexo) =0,4+0,6 = 1

Probabilidad condicionada

La probabilidad condicionada es la que está determinada o “atada” a otro


suceso o condición, que determina su aparición.

Ejemplo: Se utilizan dos tratamientos A y B para la curación de una enfermedad

Curación No curación
Tratamiento A 120 180 300
Tratamiento B 80 20 100
200 200 400

Probabilidad de curación P(C)= 200/400= 0,5


Probabilidad de no curación P (No C) = 200/400 = 0,5
Probabilidad de tomar el tratamiento A P(A)= 300/400= 0,75
Probabilidad de tomar el tratamiento B P(B) = 100/400 = 0,25

Probabilidades condicionadas:

- Probabilidad de que con el tratamiento A haya curación P(C/A) = 120/300= 0,4


Asignatura: METODOLOGIA DE INVESTIGACION
Escuela Universitaria de Enfermería de Teruel. 1er Curso de Grado. 14
_______________________________________________________________________________________

Es la probabilidad condicionada de curación condicionada al tratamiento A

- Probabilidad de que con el tratamiento B haya curación P (C/B) = 80/ 100 = 0,8
Es la probabilidad condicionada de curación condicionada al tratamiento B

Intersección de sucesos

Representa la probabilidad del suceso mixto o conjunto. Se representa


con el signo ∩ o la partícula “y”. En el ejemplo: Probabilidad de recibir el
tratamiento A y estar curado, se representa como P(A ∩ C).

En la tabla los sujetos que presentan ambos sucesos (tratamiento A y curación)


son 120 sobre 400, la probabilidad conjunta es 0,3.

Se calcula:

P(A ∩ C) = P(C/A) P(A) = (120/300)(300/400)= (0,4)(0,75 )= 0,3


o bien P(C ∩ A) = P(A/C) P(C) = (120/200) (200/400) = (0,6)(0,5) = 0,3

De la expresión P (A ∩ C) = P (C/A) .P(A), se puede extraer


P (C/A) = P (A ∩ C)/P(A)

Unión de sucesos

La unión de sucesos ∪ se corresponde con la partícula gramatical “o”, y


la operación suma.

La unión del tratamiento A con la curación, expresado como “la


probabilidad de curación o de tomar el tratamiento A” será todas las veces que
ocurra el tratamiento A o la curación
P(A∪C) = P(A) + P(C) – P (A ∩ C)= 0,75-0,5 –0,3 = 0,95

Independencia

La probabilidad de curación no es la misma con el tratamiento A: P(C/A) = 0,4


que con el tratamiento B: P(C/B)= 0,8.
Ni coincide con la probabilidad de curación total P(C) = 0,5
Podemos decir que la probabilidad de curación depende o es dependiente
del tratamiento administrado.

En el caso de que hubiera independencia la probabilidad de curación


debería ser la misma fuese cual fuese el tratamiento aplicado
P(C) = P (C/A) = P(C/B)

Aplicaciones prácticas
La teoría de probabilidades se utiliza en la decisión de aplicar métodos
diagnósticos más o menos válidos, definiendo sus propiedades de sensibilidad y
especificidad.
_____________________________________________________________________________________________________________
Asignatura: ESTADISTICA EN CIENCIAS DE LA SALUD

También podría gustarte