Clase 01. Estadística Básica

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 12

Estadística Básica para Economía y Administración.

Clase 1

Clase Nº1

La construcción del dato. Unidad de análisis,


variables y categorías.
Introducción
Hola a todos y todas,
Aquí comenzamos con nuestra primera clase de Estadística. En ella, vamos a
comenzar a trabajar con algunos elementos que nos servirán de base para poder
avanzar en la comprensión y utilización de conceptos y operaciones de mayor
complejidad.

Objetivos de la clase
Al finalizar esta clase, esperamos que logren:
- Distinguir las dos principales ramas de la Estadística.
- Diferenciar población y muestra.
- Clasificar las variables.
- Entender el dato como el producto de una construcción teórico metodológica.

Desarrollo de la Clase
Concepto de estadística.
La estadística es una rama de la matemática que, si bien es utilizada desde la
antigüedad, su uso moderno se ubica alrededor del siglo XVI, XVIII y se lo relaciona
con las necesidades de organización y control de poblaciones de los nacientes
Estados Nación en Europa. Conocer la cantidad de habitantes, sus tasas de

-1-
Estadística Básica para Economía y Administración. Clase 1

mortalidad, medir los efectos de epidemias como la fiebre amarilla, etc. fueron
algunos de los usos asociados en ese entonces a la Estadística. La etimología del
vocablo en distintas lenguas refiere a dicho uso original (Statistik en alemán,
statista en italiano).
A partir de allí, se constituye como una disciplina que irá diversificándose en sus
usos, campos de aplicaciones, y a medida que avanza el desarrollo tecnológico,
aumentarán también las técnicas y aplicaciones posibles.

En cuanto a sus usos y funciones, siguiendo el texto de Aguirre, Niño y Simonetti,


podemos resumir que:
Es una disciplina que aporta los conocimientos y herramientas insustituibles para:
• Diseñar y aplicar procedimientos de recolección de datos (experimentos, muestras, censos,
registros administrativos y fuentes secundarias), referidos a un conjunto numeroso de
personas, animales, objeto, etc.; necesarios para el estudio de un fenómeno de nuestra esfera
de interés científico, o de toma de decisiones.
• Organizar y resumir los datos masivos recogidos.
• Describir y analizar a las personas, animales u objetos observados, mediante los datos
organizados y resumidos.
• Realizar inferencias sobre la población de la que provienen los datos recogidos, cuando
estos se originan en procedimientos muestrales.
• Obtener conocimientos e información sobre el fenómeno en estudio, a partir de interpretar
los resultados del análisis estadístico.

Campo de aplicación. Utilización de la estadística en la


economía.
Los campos de aplicación son múltiples y sus fines son diversos. En Ciencias
Sociales, en la Psicología, en Ciencias de la Educación, así como en la Medicina, en
Ciencias Naturales y en Economía y Administración se valen de la estadística tanto
para conocer más sobre su campo como también para poder tomar decisiones,
intervenir y modificar la realidad función del conocimiento construido a través de
ellas.

En el caso específico de la Economía y Administración podemos citar las


definiciones de dos textos clásicos de Estadística aplicada a este campo:
“La estadística es la rama de las matemáticas que examina las formas de
procesar y analizar datos. La estadística ofrece los procedimientos para
recolectar y transformar los datos de manera que sean útiles a quienes toman
decisiones en los negocios.” Berenson

“En este sentido el término estadística se refiere a datos numéricos, tales


como promedios, medianas, porcentajes y números índices que ayudan a
entender una gran variedad de negocios y situaciones económicas.
Sin embargo, como se verá, el campo de la estadística es mucho más que datos
numéricos. En un sentido amplio, la estadística se define como el arte y la
ciencia de reunir datos, analizarlos, presentarlos e interpretarlos.
Especialmente en los negocios y en la economía, la información obtenida al reunir
datos, analizarlos, presentarlos e interpretarlos proporciona a directivos,

-2-
Estadística Básica para Economía y Administración. Clase 1

administradores y personas que deben tomar decisiones una mejor


comprensión del negocio o entorno económico, permitiéndoles así tomar
mejores decisiones con base en mejor información.” Anderson
En cuanto a las aplicaciones en los negocios y la economía, tanto Anderson como
Webster, señalan diversas áreas y usos dentro de las que la estadística resulta útil:
En Finanzas los analistas utilizan la información estadística en cuanto a la
evolución de precios y márgenes de ganancias de distintas acciones o inversiones a
lo largo del tiempo, en Marketing se realizan estudios de hábitos, tendencias,
gastos, etc. de los consumidores; en el ámbito de la Producción donde se realizan
controles de calidad como procedimiento habitual y en Economía donde los
profesionales analizan series de datos de diversos indicadores para comprender
escenarios macroeconómicos y en muchos casos realzar pronósticos.

“Casi todas las áreas del saber requieren del pensamiento estadístico. Las
disciplinas de estudio que dependen ampliamente del análisis estadístico, incluyen
—pero no se limitan a—, marketing, finanzas, economía e investigación de
operaciones. Los principios aprendidos en contabilidad y gerencia
administrativa también se basan en la preparación estadística. Los analistas
financieros y económicos con frecuencia se basan en sus habilidades
cuantitativas para proporcionar soluciones a problemas difíciles. La comprensión de
los principios financieros y económicos permitirá aplicar las técnicas estadísticas
para hallar soluciones viables y tomar decisiones.” Webster

Estadística descriptiva e inferencial.


Si bien en la actualidad la estadística ha llegado a tener múltiples ramificaciones y
campos de estudios, hay una clasificación tradicional que divide a la estadística en
dos grandes ramas. Por un lado, la estadística descriptiva y por el otro la
inferencial.

La estadística descriptiva, es la rama que se ocupa de trabajar con conjuntos de


datos, grandes en general cuyo análisis no se puede realizar “a simple vista”. Es
por esto que esta rama se encargará de organizar y resumir dichos datos para
poder luego analizarlos, interpretarlos y presentarlos, comunicarlos.
Va a describir el conjunto a partir de analizar sus características principales,
regularidades y variabilidades, sin importar si dichos datos provienen de una
muestra o un censo (como veremos luego).

La estadística inferencial, por otro lado, nos brinda herramientas para poder
inferir, proyectar, extrapolar, estimar, los resultados obtenidos en un conjunto de
datos de un sub grupo de casos (muestra) al conjunto completo del cual provienen
(población). La teoría de la probabilidad en la cual se apoya, como por ejemplo el
Teorema central del límite y la Ley de los grandes números, nos permitirán realizar
las estimaciones con cierto margen de error y brindándonos también la probabilidad
que tenemos de equivocarnos (riego) o de acertar (nivel de confianza) al hacerlo.

-3-
Estadística Básica para Economía y Administración. Clase 1

Población y muestra.
Antes de seguir avanzando es necesario que comprendamos qué es una unidad de
análisis y a qué nos referimos con universo o población1.
La unidad de análisis es cada uno de los elementos que conforman la población
o universo que hace referencia a todo el conjunto. Es por ello que hay identidad
en la definición de ambos.
La definición de la unidad de análisis y la población en estudio NO es el tema en
estudio. No es el objeto en tanto tema de interés, sino que es sobre QUE o QUIEN
vamos a relevar la información, a construir nuestros datos.
Las unidades de análisis pueden ser individuales, aunque no necesariamente se
refieren a sujetos, personas físicas, sino que también pueden ser objetos
inanimados, animales, o a colectivos como hogares, instituciones (escuelas,
hospitales) o países, provincias, ciudades, etc.

De algún modo su definición se constituye en una suerte de “criterio de inclusión”


es decir, qué características tiene que tener cierto elemento para poder ser un caso
válido y ser parte de nuestra investigación. Es por esto que esta definición plantea
un recorte bien definido y preciso de sus características relevantes y situadas
espacio temporalmente.

Por ejemplo, si yo defino mi unidad de análisis como “Cada uno de los estudiantes
de la UVQ.”, no queda claro si me refiero a los que cursaron alguna vez, los que
cursan actualmente, si corresponden a alguna carrera en especial, etc. O si planteo
“Cada uno de los jóvenes”, podría incluir a toda persona que alguna vez fue joven,
de cualquier lugar del mundo y tampoco sabríamos qué edad tiene un joven.

Si quisiéramos realizar un relevamiento sobre los alumnos de esta aula, la correcta


definición sería: “Cada uno de los estudiantes de Estadística de la UVQ en el
segundo período de 2016 del Aula Virtual 138.” La definición de la población o
universo, NO supone que la definición sea más inclusiva (todos los estudiantes de
UVQ, o de todos los cursos de estadística o de todos los períodos), sino que

1
Si bien hay algunos autores que hacen diferencia entre estos términos, o hablan de poblaciones
objetivo, teóricas, etc. a los fines de nuestro curso los usaremos como equivalentes.

-4-
Estadística Básica para Economía y Administración. Clase 1

simplemente coincide su definición, pero hace referencia al conjunto completo de


TODAS las unidades de análisis.
Cuando se realiza un estudio cuyo interés es conocer las características de cierta
población, la primera alternativa que se nos puede venir a la mente es que para
ello deberíamos entonces relevar información sobre TODO el conjunto, es decir
sobre todos los elementos que forman parte de lo que definimos como universo o
población. Este tipo de relevamiento es conocido como CENSO. El censo no es
necesariamente el Censo Nacional de Vivienda, Hogares y Población del INDEC
como el último que tuvimos en 2010, sino que puede ser Censo de estudiantes de
la Universidad de Quilmes o en cualquier otro caso donde se releve información de
todas las unidades que integran el universo en cuestión.
Pero en la mayoría de las veces, es muy raro poder realizar un censo por la
dificultad de acceder a todas las unidades de análisis que componen la población
que suelen ser muy numerosas. Los costos y el tiempo que insumen dichos
relevamientos los hacen en general poco factibles, sumados al hecho que
operativos tan grandes dificultan también poder lograr niveles de control
satisfactorios que garanticen la calidad del dato.

Es por esto que la estadística nos ofrece la posibilidad de trabajar con una muestra
de casos, es decir, NO relevar la información de TODAS las unidades sino sólo de
un subconjunto de ellas2.

El método de selección de casos nos definirá dos escenarios bien diferentes. Si los
casos son seleccionados por métodos aleatorios o al azar vamos a trabajar con
lo que se conoce como MUESTRAS PROBABILISTICAS. Dichas muestras nos

2
Nuevamente aclaramos que la muestra NO está compuesta por un recorte de elementos con
características diferentes a la de la población (población no son los estudiantes de UNQ y la muestra son
los de estadística), sino que son algunos elementos que integran el conjunto, todos con las mismas
características.

-5-
Estadística Básica para Economía y Administración. Clase 1

permiten trabajar dentro de lo que definimos anteriormente como Estadística


Inferencial, ya que la aleatoriedad en la selección de casos nos permitirá luego –
con ciertas limitaciones dadas por niveles de confianza y márgenes de error-
extrapolar los resultados de la muestra a todo el universo o población.
Las muestras cuyos casos no son seleccionados por métodos aleatorios, sino que se
eligen intencionalmente o de forma coincidental, se constituirán como
MUESTRAS NO PROBABABILÍSTICAS a partir de las cuales no se tiene el
respaldo estadístico de la teoría de las probabilidades para realizar inferencias
poblacionales. Estas muestras son igualmente utilizadas pero sus resultados
referirán sólo a los elementos relevados utilizando para ello las herramientas y
técnicas de la Estadística Descriptiva.

Cabe aclarar que cuando se habla de selección al azar no es sinónimo de “por


casualidad”. Para que se considere seleccionado aleatoriamente debe contarse con
un listado de todas las unidades de análisis que componen la población en estudio -
conocido como marco muestral- que garantice que todos los casos tengan
posibilidades de ser seleccionados y a partir de la cual se aplicará alguna técnica de
selección que asegure la ausencia de sesgos en la selección. En el caso más común
del azar simple3 todos los casos tienen una probabilidad conocida, igual y no nula
de ser seleccionados. Una imagen clásica para pensar esto es la del bolillero donde
cada bolilla es una unidad de análisis y al ser todas idénticas tienen la misma
probabilidad de salir seleccionadas.

3
El muestreo es un tema muy amplio que entre otras cosas que da cuenta de distintos tipos de
muestreos en función del modo de selección (dentro de los aleatorios se encuentras al azar simple,
sistemático, estratificado y por conglomerados) así como también muestreos polietápicos en los cuales
se van seleccionando diversas unidades de muestreo en cada etapa hasta llegar a la unidad última (por
ejemplo, se sortea una localidad, un radio censal, una manzana, un hogar y finalmente a la persona).

-6-
Estadística Básica para Economía y Administración. Clase 1

Obviamente la posibilidad de trabajar con un subgrupo de unidades de análisis


significativamente menor que el conjunto completo, permitiendo hacer un uso
eficiente de tiempos y costos y garantizando mejores controles de calidad en el
proceso del trabajo de campo, es altamente deseable siempre y cuando los
resultados obtenidos con ella sean útiles para referir al conjunto, si esa era nuestra
intención.
Lo que se espera es que la muestra funcione como una representación en miniatura
del universo, del mismo modo que podemos hacer una reducción de una imagen
con una fotocopiadora y obtener una réplica exacta sólo que a menor escala. El
objeto de las ciencias naturales no plantea en muchos casos estos problemas, dado
que sus elementos son “fungibles” –intercambiables- y que en muchos casos se
encuentran distribuidos homogéneamente –como por ejemplo la sangre en el
cuerpo que cuando necesitamos analizarla con obtener una muestra cualquiera de
una pequeña cantidad es suficiente-. Sin embargo, en las Ciencias Sociales, dado
que el objeto no presenta estas características de homogeneidad y fungibilidad,
requerimos algún procedimiento que nos garantice obtener una muestra adecuada.
Sólo el azar garantizará (aunque no con total certeza como veremos en estadística
inferencial) que la muestra seleccionada sea representativa de la población en
estudio.

Variables cualitativas y cuantitativas.


Para comenzar, es importante que definamos en primer lugar qué es una variable.
Las variables son propiedades, características, aspectos de las unidades de análisis
que resultan de interés para medirlas empíricamente. La definición de dichas
variables se encuentran en el marco teórico de la investigación. Y como su nombre
lo indica es un atributo que se espera que varíe en su resultado entre nuestras
unidades de análisis. Si esto no fuera así, si se encontrara del mismo modo en
todos nuetsros elementos sería uan constante y por lo tanto, constituiría parte de la
definición de la unidad de análisis.

Las variables –si pensamos en personas podríamos pensar como variabels de


interés, sexo, edad, nivel educativos, lugar de residencia, etc.- se expresan a partir
de los valores que pueden asumir –varón, mujer, en el caso de sexo; 18, 34, 57,
años, en el caso de la edad, etc-. Esos valores también se los conoce como
categorías. Todas las variables tienen un sistema de categorías a partir del cual se
manifiestan.

El estudio de del comportamiento de algún fenómeno –transformado en una


variable para su medición- tendrá como requisito previo poder clasificar a cada
una de nuestras unidades de análisis en alguna categoría de la/s variable/s en
estudio.

-7-
Estadística Básica para Economía y Administración. Clase 1

Así se constituye lo que vamos a llamar como la estructura tripartita del dato.
Un dato esta compuesto por tres elementos. Unidad de análisis, variable,
categoría.

Los sistemas de categorías tienen que contar con ciertos requisitos o caracteristicas
para estar construidos correctamente.
1) Criterio de Exhaustividad: Que todos los casos -u. de a.- puedan ser
clasificados en alguna categoría. Para ello, necesitamos que el sistema incluya
todas las opciones de respuesta, todos los valores posibles. Por ejemplo, si
planteamos que un sistema de categorias para nivel educativo es primario,
secundario y universitario, no cumpliriría con este criterio si puede haber
personas con estudios terciarios o sin estudios o con posgrados.
2) Criterio de Mutua Exclusión: Además de poder ser clasificados en una
categoría, tienen que clasificarse en “una y sólo una” categoría. En este sentido,
no podríamos definir como sistema de categorías, Primario, Secundarios,
Superior, Terciario, Universitario, porque quien tiene estudios terciarios o
universitarios también son superiores. O generar intervalos que van del 1-10,
10-20, etc, porque quien asuma el valor 10 no sabríamos en qué tramo ubicarlo
o lo deberíamos ubicar en ambos. Para que pueda cumplir con su función básica
de clasificar a nuestras unidades de análisis entonces, las categorías del sistema
no pueden “solaparse” entre sí.
3) Criterio de Pertinencia o Relevancia Teórica: a diferencia de los anteriores,
este criterio más que un requisito lógico, plantea que las categorías elaboradas
sean acordes alconcepto teórico con el que se está trabajando.

Además de estos requisitos del sistema de categorías, las variables pueden


clasificarse en función de distintos crietrios.
-En función de la cantidad de categorías: Se definen como dicotómicas (sólo 2
categrias) o más categorías (no dicotómicas).
-En función del rol en la hipótesis: Puede definirse como dependiente,
independiente o de control.
-Otra forma de clasificar tiene que ver con “cómo miden” sus categorías a la que se
la concoe como su nivel de medición:

Pueden encontrarse variables que clasifican o cuentas casos, a partir de cuantos de


ellos son asignados a distintas opciones, valores categóricos, semánticos. Uno
podría decir que “miden con palabras”. Estas variables como sexo, o nivel educativo
son conocidas como variables cualitativas, dado que sus categorias están
expresadas con conceptos.
Otras variables tienen sistemas de categorías en cambio, que miden con números,
a las que llamamos variables cuantitativas, edad, cantidad de miembros del
hogar, etc. son ejemplos de ello, dado que sus categorías están expresadas en
valores numéricos.

-8-
Estadística Básica para Economía y Administración. Clase 1

Dentro de las variables cualitativas se diferencia entre variables Nominales y


Ordinales. Las primeras como sexo o lugar de residencia, nos plantean sistemas de
categorías que nos permiten clasificar a nuestras unidades de análisis, pero nada
más. Sólo podemos concoer que uan caso dado tiene tal propiedad o cualidad.
Las Ordinales en cambio, si bien también son cualitativas, además de permitirnos
clasificar a nuestros casos, nos posibilitarán jerarquizarlos u ordenarlos a partir
de algún criterio. Por ejemplo, nivel educativo nos perimite saber que alguien con
primario tienen menos estudio que alguien con secundario incompleto, aunque no
sepamos cuantitativamente cuanto menos estudio.
Las variables cuantitativas o numéricas nos nos permitirán además de las ya
mencionadas propiedades de clasificación y ordenación, cuantificar las
distancias entre las categorías y realizar operaciones matemáticas con
ellas. Quien tiene 20 años no sólo tiene mas que alguien de 18, sino que tiene
exactamente 2 años más.

Por último las variables cuantitativas pueden distinguirse entre variables discretas,
en el caso que sólo admita números enteros como valores posibles –por ejemplo,
cantidad de miembros del hogar- o continuas si puede tener valroes decimales –
como edad, altura, peso, etc.- los redondemos o no, admiten dicha posibildiad.

Comprender los niveles de medición de nuestras variables es un tema fundamental


para la estadística dado que no todas las herramientas nos servirán para todos los
niveles de medición. Por ejemplo, como veremos en las próximas clases, de la
variable edad pordíamos obtener un promedio o media aritmética de años de cierta
población, no así de la varable sexo.

En el siguiente cuadro pueden ver los distintos niveles de medicion según sus
funciones y ejemplos.

-9-
Estadística Básica para Economía y Administración. Clase 1

Etapas en el análisis estadístico.


Para finalizar es importante conocer que los datos no aparecen o se encuentran
“naturalmente” sino que son producto de un largo proceso que involucra distintas
etapas y decisiones teórico metodológicas en cada una de ellas.
Las etapas del análisis estadístico pueden plantearse en analogía con las etapas del
proceso de investigación. Si bien muchas veces sólo se ubica a la estadística en el
momento final del análisis e interpretación de los resultados, en muchos pasos
previos la utilizamos también para tomar decisiones que nos permitan tener un
diseño coherente y llegar a los resultados buscados.

Podemos agrupar a las etapas de investigación en 5 grandes momentos.


• La Fundación del Problema: Esta etapa incluye la definición y formulación de
la pregunta problema, la elaboración del marco teórico y los antecedentes de
investigación, la definición de los objetivos y el planteo de las hipótesis. Si bien
aquí no encontramos elementos estadísticos propiamente dichos, el tipo de
objetivos (descriptivos o explicativos, por ejemplo) definirán qué tipo de análisis
de datos llevar adelante en función de los requerimientos lógicos de la que cada
uno implica. Las hipótesis también serán contrastadas estadísticamente en
muchos casos a partir de tests específicos y/o de tablas bivariadas.
• Diseño Teórico Metodológico: En esta etapa se define el enfoque que deberá
ser cuantitativo si vamos a hacer análisis estadístico. También aquí
definiéremos la unidad de análisis, las variables y categorías a trabajar, así
como también decidiremos si trabajaremos con un censo o muestra y cómo
seleccionaremos los casos y cuántos haremos. Finalmente, antes de salir a
relevar los datos, deberemos elaborar un instrumento (formularios, cuestionario
estructurado que nos permita el registro homogéneo de la información). Como
vemos, aquí aparecen muchas definiciones de las que trabajamos en la clase de
hoy que son fundamentales para poder avanzar con el análisis posterior.
• Trabajo de Campo: Relevamiento de la información. Se realizan las encuestas
a las unidades seleccionadas garantizando la correcta aplicación del
instrumento.
• Post-campo: En esta etapa se realiza el ingreso de datos en la matriz, se
aplican criterios de consistencia para realizar la limpieza de la matriz y también
se codifican las respuestas que se registraron de forma abierta en el
cuestionario. También se construyen nuevas variables a partir de
combinaciones o reagrupaciones de las existentes y se procesan los datos
siguiendo un plan de análisis. En este punto, ya comenzamos con el análisis
estadístico de datos dado que pensar criterios de consistencia, generar
categorías y variables nuevas y cómo realizar cruces de variables o qué medidas
estadísticas utilizar son decisiones que involucran integralmente el manejo de
las herramientas y conceptos de la disciplina.
• Análisis de datos: Finalmente, aquí tenemos el análisis propiamente dicho, a
partir del cual se estará intentando responder las preguntas planteadas en la
primera etapa a partir de contrastar empíricamente las hipótesis de trabajo. Las
diversas herramientas (muchas de ellas iremos viendo en las próximas clases)
como el análisis univariado, bivariado, y técnicas multivariadas complejas

- 10 -
Estadística Básica para Economía y Administración. Clase 1

Cabe aclarar que no todas las investigaciones trabajan con datos primarios.
Dichos datos son los que se producen dentro del mismo proceso de investigación
que se está llevando a cabo.
En otras situaciones se trabaja con datos secundarios, que son datos que se
relvaron en el marco de otras investigaciones, y que los utilizamos para nuestros
propios objetivos, en algunos casos se pueden reutilizar, volver a hacer cálculos o
tablas, pero no fueron relevados para nuestra investigación. Ejemplos típicos de
esta situación son las investigaciones que utilizan datos producidos por organismos
de estadísticas, instituciones públicas, empresas, etc.

Cierre

Hemos visto las definiciones básicas que nos servirán de punto de partida para el
análisis estadístico.
La estadística es una rama de la matemática que opera de diversas formas con
datos. Los datos tienen una estructura tripartita compuesta por unidad de
análisis, variables y categorías.
Hay distintos tipos de variables según el nivel de medición de las categorías
(Nominal, Ordinal o Numérica) que implicarán una utilización diferencial de las
distintas herramientas con las que trabajaremos.
El trabajo con censos o con muestras nos plantean el uso de conceptos provistos
por la estadística descriptiva (en ambos casos nos permite describir, resumir
recopilar, organizar la información) y por la estadística inferencial (en el
caso del trabajo con muestras probabilísticas para poder realizar estimaciones
poblacionales).
Por otro lado, son resultado de un proceso de producción o construcción en el
marco de una investigación científica/académica o para resolver problemas en el
marco de incumbencias profesionales en distintos ámbitos.

Actividad práctica

Responder consigna de la tarea en el aula sobre unidad de análisis, variables,


categorías y niveles de medición.

Bibliografía

Material Obligatorio:

- 11 -
Estadística Básica para Economía y Administración. Clase 1

Aguirre, Niño, Simonetti E. Estadística aplicada en las Ciencias Sociales Y Humanas.


Estadística I. Editorial Universitaria de Misiones, 2005. Capítulo 1.

Bibliografía Complementaria:
Berenson y D.M. Levine. (2001). Estadística para Administración y Economía.
Editorial Pretice Hall. 2º edición. México.2001. Capítulo 2: “Recolección de datos”

- 12 -

También podría gustarte