0% encontró este documento útil (0 votos)
36 vistas4 páginas

Unidad 1

Descargar como pdf o txt
Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1/ 4

Estadística y Probabilidad

UNIDAD NRO 1: Análisis de Datos de Negocios

Qué es la estadística? Breve reseña histórica

Hasta el siglo XVII, la estadística se ocupaba solamente de la recolección de información (numérica)


con el fin de describir los hechos o las poblaciones que proporcionaban la información recolectada.
Esto cambió a partir de la teoría del cálculo de probabilidades (desarrollada en Francia). La
estadística moderna abarca la recolección, presentación y caracterización de información para
ayudar tanto en el análisis de datos como en el proceso de toma de decisiones.
Se distinguen dos tipos de estudios:
1. Estudios enumerativos: involucran la toma de decisiones respecto a una población y/o sus
características. Ej: encuestas políticas. En estos casos el enfoque del estudio está puesto
sobre el conteo de los resultados obtenidos a partir de un listado de los elementos de la
población, llamado marco de muestreo
2. Estudios analíticos: involucran la realización de alguna actividad sobre un proceso para
mejorar el desempeño en el futuro. La atención está puesta sobre la predicción del
comportamiento futuro de un proceso y sobre la comprensión y perfeccionamiento de este
proceso. Ej: proceso de fabricación.

El crecimiento y desarrollo de la estadística se debe a dos hechos principales:


● El surgimiento del estado moderno, con la necesidad de los gobernantes de recabar datos
sobre los recursos del país para tener éxito en su gestión.
● El desarrollo en las matemáticas de la teoría de probabilidades, que nació como
consecuencia del auge de los juegos de azar.

La estadística es la ciencia que le extrae información a los datos, permite la toma de decisión
en situaciones de incertidumbre, y cuantifica el riesgo de tomar una decisión equivocada.
El fin último u objetivo de la estadística es: hacer inferencias (predecir, decidir) sobre algunas
características de una población con base en la información contenida en una muestra.

Definición de Estadística de negocios: Se refiere a las técnicas mediante las cuales se recopilan,
organizan y analizan datos cuantitativos. El punto central del análisis estadístico en los negocios es
la administración de la toma de decisiones.
Estadística Descriptiva Estadística Inferencial

Métodos que incluyen la recolección, Métodos que hacen posible la estimación de


presentación y caracterización de un conjunto una característica de una población o la toma
de datos con el fin de describir de una decisión referente a una población,
apropiadamente las características de ese basándose sólo en los resultados de la
conjunto de datos. muestra.
Técnicas que se relacionan con el resumen y Técnicas por medio de las cuales se toman
descripción de datos numéricos. decisiones sobre una población estadística
basadas en una muestra o en juicios de los
administradores.

Las características medidas en una muestra se denominan estadísticas muestrales, las


características medidas en una población estadística se llaman parámetros poblacionales.

Estadística Clásica Análisis Bayesiano

Análisis de datos muestreados, con propósitos Incorpora el uso de juicios de los


de hacer inferencias, excluyendo todo juicio u administradores en el análisis estadístico y
opinión personal. también pone énfasis en las ganancias o
pérdidas asociadas con decisiones alternativas.

CONCEPTOS BÁSICOS
● Población: Conjunto formado por todas las mediciones de interés (población estadística). La
población de unidades es el conjunto formado por todas las unidades de las cuales nos
interesa la información o sobre las cuales hacemos las mediciones. Ej: si del conjunto de
estudiantes de la clase nos interesa la estatura, entonces la población de unidades es el
conjunto de estudiantes y la población estadística es el conjunto de mediciones obtenidas
de la estatura de cada unos de ellos.
● Muestra: colección de mediciones seleccionadas de la población de interés (muestra
estadística). Los objetos que componen la muestra se llaman unidades experimentales o
unidades estadísticas, y constituyen la muestra de unidades. La representatividad de la
muestra es muy importante, significa que la característica en estudio se distribuye en la
muestra de manera semejante a como lo hace en la población. Si la representatividad no
cumple la condición, los resultados obtenidos son errados.

Razones para extraer una muestra: resulta más económico en tiempo y dinero que realizar un censo
y evita cometer errores del investigador. La determinación de las características de la población
debe basarse en la información obtenida de una muestra representativa. Aquí es donde tiene
importancia el aporte de la teoría de probabilidades que permite calcular la probabilidad de que los
resultados de la muestra reflejen los resultados de la población, es decir, tener una medida de error
que posiblemente cometamos al hacer la generalización de características de la muestra a las de la
población (medida de bondad de cada inferencia).
● Parámetro: medida estadística que se calcula en base a la población estadística. Es una
característica de la población.
● Estadístico: medida estadística que se calcula en base a una muestra representativa de la
población. Es una característica de la muestra.
Ej: Si queremos conocer el ingreso familiar promedio de VM, pero no disponemos de tiempo para
realizar un censo, debemos tomar una muestra representativa de la población y calcular el
promedio muestral del ingreso familiar. Esta medida estadística es un estadístico, en oposición al
promedio verdadero que obtendríamos si realizamos un censo, el cual sería un parámetro.
Un censo se hace sobre toda la población es el proceso de medir las características de todos los
miembros de una población, en cambio una encuesta se hace sobre una muestra representativa de
la población.

● Pensamiento estadístico: procesos de pensamiento que se centran en formas de


comprender, manejar y reducir la variación. Incluye en reconocimiento de que los datos son
inherentemente variables, y que la medición, control y reducción de la variación permite
mejorar la calidad.

● Variable: característica en estudio o de interés de la población. Ej. sexo, estado civil, número
de integrantes de una familia, número de ingresos, ingreso total.

- Variables numéricas: arrojan datos numéricos. Edad, estatura, temperatura, distancia,


humedad, presión arterial, número de hijos, costo de producción, utilidades, coeficiente
intelectual, producción diaria, etc. Las variables numéricas pueden ser:

Discretas Continuas

Surgen de un proceso de conteo. Sólo puede Surgen de un proceso de medición. Supone un


tener valores observados en puntos aislados a valor en cualquier punto fraccionario de un
lo largo de una escala. Nro de personas, nro de intérvalo. Distancia, estatura, capacidad, peso,
artículos. Se puede definir como aquella para la humedad. La diferencia entre dos
cual la diferencia entre dos observaciones observaciones puede ser un infinitésimo. EL
cualesquiera, es finita. INGRESO ES UNA VARIABLE CONTINUA.

- Variables categóricas: arrojan datos categóricos. estado civil, sexo, nivel educativo, nivel
socio-económico, afiliación política, religión, tipo de cambio, clima, etc.

Existen 4 niveles de medición para los distintos tipos de datos, que son, del más débil al más fuerte,
las escalas:
● Nominal: Se utiliza para datos categóricos. Es aquella en la cual los datos se clasifican en
distintas categorías, entre las cuales no existe un orden jerárquico ni medida de
distancia. Ej. Estado civil, religión, raza.
● Ordinal: Se utiliza para datos categóricos. Es aquella en la cual los datos se clasifican en
distintas categorías, entre las cuales sí existe un orden jerárquico pero no medida de
distancia. Ej. nivel de educación, clase social, calificación de un producto. El orden
jerárquico entre las distintas categorías indica sólo qué categoría es “mayor”, “mejor” o
“preferida”, pero no cuánto.
● De intervalo: Se utiliza para datos numéricos. Es una escala en la que, además de existir
orden, existe una medida de distancia entre dos observaciones, el “cero” de la escala es
convencional. El cero es arbitrario, puesto en el nacimiento de Cristo, o la escala para medir
la temperatura en grados centígrados, en la que el cero es también relativo.
● De razón (o cociente): Se utiliza para datos numéricos. El cero en esta escala sí indica la
ausencia de atributo, es cero absoluto. El cero es natural. EJ. Escala Kelvin, el 0 indica
ausencia total de calor, longitud, estatura, salario, número de artículos defectuosos.
Las escalas de intervalo y de razón se consideran niveles de medición más sólidos, porque se puede
saber no sólo qué valor observado es el mayor, sino también cuánto mayor es.

OBTENCIÓN DE DATOS A TRAVÉS DE EXPERIMENTOS Y ENCUESTAS


Una manera de obtener datos es a través de la observación directa. Un experimento estadístico es
una forma de observación directa en la que se controlan algunos o todos los factores que pueden
influir sobre la variable que se estudia.
A veces, no es posible obtener datos en forma directa, la información debe obtenerse a partir de
respuestas individuales. Una encuesta estadística es el proceso de recopilar datos pidiendo a
personas que proporcionen información.

MÉTODOS DE MUESTREO ALEATORIO


Muestreo aleatorio: es aquel en el que cada uno de los elementos de la población de interés tiene
una probabilidad conocida, y frecuentemente igual, de ser elegido para la muestra.
Son 4 los principales métodos de muestreo aleatorio

Aleatorio Simple Los elementos se escogen en forma individual y al azar de la totalidad


de la población. Todo elemento de la población tiene la misma
probabilidad de ser seleccionado. Los elementos de la población
deben ser enumerados. Conviene usarlo cuando la población es
pequeña y homogénea respecto de las características en estudio.

Sistemático Se eligen los elementos de la población a intervalos uniformes, a


partir de un listado ordenado. Asegura una representación uniforme
de los elementos de la población. No debe usarse cuando hay
periodicidad oculta en la población.

Estratificado Se clasifican los elementos de la población en subgrupos separados


de acuerdo con una o más características importantes. Después, se
obtiene por separado una muestra aleatoria simple o sistemática de
cada estrato. Conviene usarse cuando se trata de poblaciones
heterogéneas.

Por conglomerados Tipo de muestreo aleatorio en el que los elementos de la población


se dividen en forma natural en subgrupos. Así, se eligen al azar los
subgrupos que forman la muestra.

También podría gustarte