Departamento de Ciencias de la Tierra y
Construcción
Unidad 1
Mediciones Hidrológicas
Probabilidad Y Estadística
Un proceso probabilístico en hidrología consiste en un conjunto de
variables al azar
(generalmente series de tiempo), es decir, variables (eventos) que toman
valores en una secuencia a través del tiempo (horas, días, meses, años).
Estos procesos pueden ser muestreados en forma discreta o continua.
En hidrología, se trabaja con eventos naturales irrepetibles registrados en
períodos de tiempo cortos, a diferencia de otras ciencias que trabajan con
registros que se pueden reproducir por experimentación.
La estadística trata del ordenamiento y computación de los datos
registrados de una muestra. La probabilidad, por otro lado, es el cálculo o
medida de la posibilidad de ocurrencia de valores iguales a los de la
muestra.
Datos Hidrometeorológicos
Existen varios tipos de datos usado en hidrología:
• Datos históricos de eventos naturales registrados cronológicamente en
forma discreta ó continua. Son series de tiempo producto de observaciones
y que se pierden si no se registran en el momento de su ocurrencia. A este
tipo pertenecen la gran mayoría de los datos hidrológicos e
hidrometeorológicos.
• Levantamiento de datos hidrológicos en áreas, como por ejemplo
profundidad y calidad de aguas subterráneas, infiltración o sedimentación
en ríos. Son datos de campo que se toman esporádicamente y no
necesariamente, en forma secuencial.
• Medidas en laboratorio, como lo son conductividades hidráulicas o calidad
de aguas.
• Registro simultáneo de un evento (lluvia-caudal) en dos localidades
geográficas diferentes, durante un determinado período de tiempo
(generalmente 4 ó 5 años) usados para transferir información ó
correlacionar datos con propósitos diversos, como lo son análisis de
caudales.
Los datos hidrológicos deben ser independientes, homogéneos y lo más
representativos posible de la población.
Las fuentes de los errores en datos hidrológicos observados pueden ser: en
el sensor (error del registro del dato in situ),en la transmisión del dato, en el
registro en la estación de recepción, en el procesamiento y análisis de los
datos.
Dentro de los errores, se consideran errores al azar y errores sistemáticos.
Los primeros están siempre en los datos, generalmente se distribuyen
alrededor del verdadero valor y la desviación standard se usa para
determinar la magnitud de los desvíos.
Los segundos crean inconsistencias o diferencias en un sólo sentido en
relación al valor medio que deben ser detectadas y corregidas.
Otro tipo de datos a tener en cuenta son los no homogéneos o datos
afectados por algún efecto, no necesariamente hidrológico que
repentinamente cambia la tendencia normal de una serie de registros.
En los registros sistemáticos de caudales ante cualquier situación de no
homogeneidad, debe detectarse su causa. En las proyecciones
estadísticas de variables hidrológicas, resulta primordial contar con datos
libres de errores significativos. Igualmente, en series de tiempo de
fenómenos hidrológicos los datos faltantes, deben ser en lo posible
rellenados por análisis de correlación o análisis regionales de datos
vecinos.
Variables Aleatorias
Una variable aleatoria X(t) tiene una cierta distribución probabilística. Esa
distribución determina la posibilidad de que una determinada observación
X, de la variable, caiga dentro de un rango especificado de X. Sí, por
ejemplo la precipitación media de enero, en un lugar, es de 50 mm, la
distribución probabilística podría establecer que pueda estar en el rango
entre 40 y 60 milímetros.
Series de Tiempo
Una serie de tiempo se define, en hidrología, como la magnitud de un
evento observado en forma discreta a intervalos de tiempo, dt,
promediados en ese intervalo o registrados en forma continua en un
tiempo, t, por ejemplo caudales medios, diarios, promedio de caudales
instantáneos a través de un intervalo discreto de 1 día, o caudales
instantáneos registrados en forma continua durante todos los instantes de
cada día.
Las series de tiempo en hidrología pueden ser series de duración
completa, en la cual figuran todos los registros de la muestra, o series de
duración parcial, donde los datos se seleccionan de tal manera que su
magnitud es mayor (o menor) que un valor base predefinido.
Parámetros Estadísticos
Un parámetro estadístico es el valor esperado de alguna variable aleatoria
o de alguna función, es decir, son estimadores de las muestras para
caracterizarlas.
Medidas de tendencia hacia un valor central de la serie
Promedio aritmético o media aritmética (μ) es el primer momento alrededor
del origen. Aunque da información sobre la muestra, este parámetro no
caracteriza completamente a una variable aleatoria.
Si la muestra es pequeña y contiene valores extremos (altos o bajos) el
promedio no será un parámetro real en relación con la población. Se
calcula mediante la expresión:
Donde: xi es valor observado de la variable.
N es el número de observaciones.
Promedio geométrico: se calcula con la siguiente expresión:
Mediana (M): es el valor de la variable que deja con igual probabilidad de
ocurrencia (0.50) los valores abajo y arriba de ella, por lo tanto, la
mediana resulta atractiva, en el caso de series que se apartan de la
normal.
Moda: es el valor de la variable que ocurre con mayor frecuencia (ver
ejemplo 4.2 para ilustración del calculo de estos parámetros ).
Los tres parámetros (la media aritmética, la mediana y la moda) son
iguales para distribuciones simétricas. Para series pequeñas, se
justifica el uso de la mediana, porque el promedio se afecta en ellas
mucho más por los valores extremos y es además más robusta. En
la práctica hidrológica en series que se apartan de la distribución
normal es común usar los logaritmos de la variable.
En hidrología se tienen frecuentemente muestras de distintos
tamaños N1, N2, N3 ... NR y se necesita obtener el promedio
ponderado de todas ellas, así:
Medidas de Dispersión
Las medidas de dispersión miden como los valores de una variable se
dispersan alrededor del valor central o media aritmética de la serie, es decir,
representan una distribución alrededor de un valor medio.
• Desviación media (σM): Es la media aritmética del valor absoluto de los
errores. Se calcula con la siguiente expresión:
• Desviación estándar (σ): Es el parámetro de dispersión más usado en
hidrología, se llama también desviación cuadrática. Es la raíz cuadrada de
la varianza y tiene las unidades de X.
• La varianza: es el cuadrado de la desviación estandar (σ2) y es el
segundo momento alrededor de la media. Sus unidades son el cuadrado
de las unidades de la variable. En general, es un indicador que indica
cuanto cerca de la media está el valor de la variable. Si teóricamente
todos los valores fueran igual a la media, la varianza sería cero.
La ecuación de la varianza (4.5a) se puede también expresar
desarrollando el trinomio cuadrado perfecto del numerador.
• Covarianza. Cuando se analiza la varianza de dos (X, Y) ó más variables
(X, Y, Z). En el caso de dos variables, la covarianza es la media aritmética
del producto de los errores de X, e Y, y se expresa mediante la siguiente
ecuación:
• Coeficiente de variación: es el cociente entre la desviación standard y
el promedio, X . Es adimensional.
Si una variable x es multiplicada por una constante C, la varianza, σ2, y la
desviación estándar, σ, se multiplican por C2 y por C, respectivamente;
consecuentemente, el coeficiente de variación Cv no se afecta. Si una
constante C se suma o resta a cada uno de los valores de una variable (ej.
cambio de origen) la σ y σ2 no cambian, pero el Cv varía, así:
• El coeficiente de asimetría (g): Es el tercer momento alrededor de la
media. Describe la distribución de los datos alrededor de media. Es una
medida de la simetría. Una distribución simétrica tiene un coeficiente de
asimetría igual a cero cuando los datos se distribuyen alrededor de la
media; negativo cuando la distribución de los datos tiene mayor sesgo a
la izquierda y positivo cuando tiene mayor sesgo a la derecha, según
como se desvíe hacia valores bajos o altos con relación a la media. Es
un parámetro muy usado en estudios regionales, se calcula con la
expresión:
Los momentos centrales en general,
x de orden r se estiman para
muestras como:
Donde: N es el número de observaciones.
x son los valores observados.
es el promedio aritmético de la muestra.
Cuando se trabaja con valores altos de la variable (ejemplo caudales)
conviene trabajar con logaritmos.
Ejemplo
Dados los valores de lluvias en milímetros de la Tabla 4.2, encontrar: (a)
promedio aritmético, (b) mediana, (c) moda, (d) promedio geométrico (e)
rango, (f) desviación estándar y (g) varianza.
Ejemplo
Calcular el promedio ponderado de los valores de lluvias observadas en
las estaciones que se presentan en la Tabla anterior, para las áreas de
influencia respectivas.
Probabilidad
Secuencia de eventos independientes
Si un número k de eventos al azar pueden ocurrir como eventos
independientes (Yevjevich, 1972) A1, A2,…, Ak y si cada uno de ellos
tiene las probabilidades de P(A1) = p1; PO(A2) = p2;…;P(AR) = pk,
entonces, la probabilidad de un evento asociado como la condición de una
secuencia de observaciones independientes (Teorema del límite) es:
La probabilidad que en n observaciones o ensayos hayan m1 de eventos
Ai,m2 de eventos A2 y mk de eventos Ak, se conoce como la ley de la
distribución múltiple:
Para k = 2, p1 = o; p2 = q = 1-p, m1 = m; m2 = n-m; de la ecuación
resulta la ley de la distribución binomial, o sea que:
Eventos mutuamente excluyentes
Supóngase que un evento A puede ocurrir solamente en forma conjunta
con otros eventos al azar mutuamente excluyentes (Yevjevich, 1972), E1,
E2, …, En∑(Ei) = 1; i = 1, 2, …, n, la probabilidad del evento A es:
Eventos mutuamente excluyentes
Supongamos que un evento A puede ocurrir solamente en forma
conjunta con otros eventos mutuamente excluyentes (Yevjevich,
1972) E1, E2,…, En de tal forma que ∑P(Ei) = 1, i = 1, 2,…,n es
decir que la probabilidad de un cierto evento A es:
Donde, (i = 1, n)
Si dos variables (x, y) pueden ocurrir solamente en forma conjunta
(y/x) la función de probabilidad P(y/x) de una variable
condicionada, es decir que y ocurre si, y solo si, ocurre x, se
define como:
Como resultado, la probabilidad conjunta P(A, Ei) se puede
expresar como:
Por lo que ahora se puede reescribir la primera ecuación con
relación a la probabilidad del evento A, es decir:
Donde, (i = 1, n)
Este es el teorema de la probabilidad total. La condición para poder
aplicar el teorema de la probabilidad total es solamente en el caso
de que eventos Ei (i = 1, n) sean mutuamente excluyentes. Los
mismos puede tener diferentes probabilidades, es decir que no son
eventos equiprobables.
Ejemplo:
Si se tiene un gran río y sus tributarios, y sea A la probabilidad de
tener una creciente máxima en el valle inferior y E1, E2,…; En, las
probabilidades de eventos, en un cierto rango, de los tributarios.
Debido a que es poco frecuente que las tormentas afecten a toda
la cuenca, la contribución simultánea de todos los tributarios es
poco probable.
En este caso, el evento condicionado (A/Ei) sería el caso que la
inundación en el valle, en el río principal, exceda el nivel crítico
siempre que los eventos Ei ocurran. La ecuación del teorema de
la probabilidad total permite calcular esa probabilidad de la
creciente en el valle (A) en función de las probabilidades de
eventos en los tributarios del río (Ei)
Análisis de frecuencia
Si de una muestra de N de valores Xi de una variable discreta,
existen ni casos de un determinado evento, Xi. Estos ni casos son la
frecuencia absoluta de los eventos Xi. Las frecuencias relativas de
definen como:
En las frecuencias absolutas ∑ni = N; en la frecuencias relativas ∑ni
= 1.
La suma de los valores de las frecuencias relativas es la frecuencia
acumulada, de tal forma que:
Ejemplo: si una muestra de 180 días, hay 30 días con tormentas y
150 sin tormentas, la frecuencia absoluta de días/tormenta es 30 y
su frecuencia relativa es 30/180 o 0,1667 días con tormentas.
Período de retorno
El objetico primario del análisis de frecuencia de una serie
hidrológica es determinar el período de retorno de un evento de
determinada magnitud. La frecuencia experimental de una muestrea
es la asignación a cada uno de los elementos de una serie
determinados valores basados en el ordenamiento de los mismos,
de acuerdo a su magnitud.
Para ello, lo primero que se debe realizar es ordenar los valores
registrados de mayor a menor para frecuencias de valores altos, o
de menor a mayor para frecuencias de valores bajos, y asignarles
una posición de 1 a N para calcular la frecuencia y representarla
gráficamente.
Para calcular la frecuencia y representarla gráficamente, comparar
gráficas o analíticamente la función de distribución de
probabilidades o calcular la frecuencia experimental se han
propuesto diversas expresiones y solo se indicarán aquellas de uso
práctico.
La más conocida es la fórmula de Weibull
N es el tamaño de la muestra (N valores de lluvia o N valores de
caudales).
La inversa de P(x) se denomina período o tiempo de retorno o de
recurrencia (TR). EL período de retorno de un evento de una
magnitud dada, es el tiempo promedio entre eventos que igualan o
exceden esa magnitud. Es el intervalo dentro del cual un evento de
determinada magnitud puede ser igualado o excedido, sin que ello
implique la indicación del momento en que éste pueda ocurrir.
Si la muestra de la variable se refiere a un año, un mes o una
estación, el TR estará referido a ese período y se cuenta en años,
meses o estaciones climáticas (Yevjevich, 1972).
Otras fórmulas de uso práctico son:
El método de California
Hazen desarrolló una fórmula intermedia entre las posiciones
dadas por el método de California y se define como:
La desventaja de la ecuación del método de California es que da
P(x) 0 1 para m = N y la segunda ecuación da P(x) = 0, para m = 1,
ambos valores imposibles.
Para series parciales (valores por encima de una base) y valores
altos, lo más aconsejable es la expresión de Hanzen, y para
valores bajos la primera ecuación del método de California
(Yavjevich, 1972)
En díselo hidrológico, interesa el riesgo de falla en el período útil
de una estructura, si la probabilidad de ocurrencia anual P de un
evento es:
Y la probabilidad de no ocurrencia es:
La probabilidad de que un evento igual o mayor a uno dado pata
determinado TR ocurra en n años es:
o
Problema 1:
Calcular el tiempo o período de
retorno, con la fórmula de Weibull,
para una serie anual de 43 años de
caudales máximos medios diarios
(Tabla 4.4) en el río Mendoza en
Guido (Mendoza, Argentina).
Distribuciones de probabilidad
Teniendo en cuenta que en hidrología los registros disponibles son una
pequeña muestra de la población, resulta lógico probar diferentes
distribuciones para obtener aquella que mejor se ajuste.
Prácticamente todas las distribuciones de variables aleatorias en
hidrología son de naturaleza empírica, obtenidas de un número limitado de
datos. Las funciones de distribución de probabilidad, tienen parámetros
que deben ser estimados a partir de la muestra. Desde el punto de vista
matemático si una función tiene más parámetros, es más flexible para
ajustar a una distribución empírica.
En realidad el número de parámetros es un compromiso entre flexibilidad y
confiabilidad en la estimación de los mismos. Si el número de parámetros
de una distribución es muy pequeño, la función no será flexible al ajuste,
por otro lado si su número es grande, algunos de esos parámetros serán
poco confiables.
Distribución de variables discretas
Si una muestra de x valores discretos involucra distribuciones de
probabilidad donde se consideran situaciones de si (p) o de no (q), se
obtienen probabilidades complementarias (p + q = 1). Estas situaciones
surgen cuando se considera la probabilidad de valores cero o no cero.
Una de estas distribuciones es la binomial que se basa en el concepto de
probabilidad de x eventos en n años antes descripta. En este caso, la
función de frecuencia acumulada es un gráfico que va de cero a uno (b),
mientras que la función de frecuencia relativa (4a) da la probabilidad de
cada evento 0, 1, 2, etc. La suma de esas probabilidades es 1.
En hidrología existen casos
frecuentes de este tipo de variables,
como por ejemplo: el número de
días de lluvia por año, la situación
de un día positivo para tormentas
convectivas o nó, días con
temperaturas que producen heladas
en cultivos o no, el número de días
con nevadas, etc.
Dentro de este tipo de
distribuciones se encuentran la
binomial, la Poison y la binomial
negativa.
Distribución binomial
La distribución discreta binomial de probabilidad se aplica a poblaciones
que sólo tienen dos eventos discretos y complementarios. Una condición
esencial para esta aplicación es la independencia de eventos sucesivos
(observaciones o experimentos) y las probabilidades constantes p y q de
cada ensayo individual. Esta condición se debe verificar con los datos a
utilizar. La función de probabilidad acumulada es:
Donde: x es el número de veces que ocurre el evento.
P(x) es la probabilidad de ocurrencia x = 0, 1, 2 .... etc.
n es el tamaño de la muestra ( número de observaciones independientes o
casos posibles).
m es el número de eventos.
q es la probabilidad de no excedencia, dada por:
p es la probabilidad de excedencia, calculada mediante la expresión:
es el número combinatorio de n valores tomados de x, se evalúa así:
Si x = 0 el número combinatorio es igual a 1
Otro concepto importante en diseño hidrológico, es determinar la
probabilidad de que un evento de una especificada magnitud y probabilidad
de ocurrencia, pueda repetirse x veces en n años. Esto se realiza mediante
la función binomial de densidad de probabilidad:
Desde el punto de vista estadístico, n es el número de observaciones
independientes (años de la vida útil), x es el número de ocurrencias de un
evento en n años; p(x) es la probabilidad de que un número x de
ocurrencias se produzcan en n observaciones (años); p es la probabilidad
anual de ocurrencia (1/TR) y (1-p) es la probabilidad de ocurrencia negativa
(fallas) del evento. El coeficiente binomial
La binomial es la función más usada para distribuciones discretas, es
decir, cuando se tienen dos eventos discretos y complementarios (lluvia-no
lluvia). Es fundamental en la aplicación de esta distribución la
independencia de los sucesivos eventos.
Se supone, en general que los sucesivos días de lluvia y no lluvia son
eventos independientes, lo cual no es estrictamente correcto, salvo para
lluvias de tipo convectivo donde si se satisface esta condición con una
aceptable aproximación.
En una distribución binomial los eventos pueden ser clasificados sólo en
dos categorías: aciertos o fallas (si o no – lluvia o no lluvia, etc.). Los
parámetros estadísticos de esta distribución son:
El valor esperado (promedio):
La varianza:
El coeficiente de asimetría:
El coeficiente de kurtosis:
Si p = 0, la distribución es simétrica. La distribución binomial tiende a la
función de densidad de probabilidad normal, cuando n, tiende a infinito. Si
n p3/2 > 1.07, el error de estimar probabilidades usando la distribución
normal en lugar de la binomial, nunca excede de 0.05 para cualquier valor
de x.
Se debe notar que p y n son dos parámetros independientes, p es
usualmente estimado considerándolo igual a la frecuencia, f, del primer
evento, es decir, evento “si” de todas las observaciones disponibles en la
muestra de tamaño n, o sea,
siendo m el posicionamiento del valor en la muestra de ocurrencia en la
muestra de tamaño n.
Distribución de Poisson
Un caso interesante se presenta cuando el tamaño de la muestra, n, es
muy grande y tiende a infinito, mientras que la probabilidad, p, muy
pequeña y tendiente a cero, pero su producto, m, es un número positivo,
entonces se tiene la función de densidad de probabilidad discreta de
Poisson:
Donde x es el número de ocurrencias de un evento de pequeña
probabilidad p, en un gran numero de situaciones n. Es frecuente que una
muestra grande (n grande) sea observada para un evento de muy baja
probabilidad de ocurrencia. Los parámetros estadísticos de esta
distribución son:
El valor esperado (promedio):
La varianza:
El coeficiente de asimetría:
El único parámetro es m. Cuando teóricamente n tiende a infinito y p tiende
a cero, pero su producto m tiende a un valor constante, se selecciona esta
distribución.
La aplicación de la Poisson en hidrología, resulta apropiada en caso de
eventos poco frecuentes que ocurren al azar, ya sea a través del tiempo o
del espacio, ó, eventos que ocurren instantánea e independientemente en
el tiempo, como lluvias producidas por celdas convectivas.
Distribución binomial negativa
Esta distribución es un caso especial de la binomial con índice negativo. Se
usa cuando en un muestreo se supone que el número de observaciones n,
no es fijo. Evidentemente el individuo final (nth) siempre será un suceso
positivo ( Kendall y Stuart, volumen I, 1969 ) pero es determinado como el
tamaño de la muestra requerida para lograr r sucesos positivos. Por lo
tanto, la frecuencia relativa (distribución binomial negativa o de Pascal)
para obtener r sucesos positivos a partir de n individuos es:
Distribuciones de variables continuas
Las distribuciones continuas se caracterizan porque F(x) es
absolutamente continua. Por consiguiente F(x) tiene una derivada:
F’(x) = f(x)
La función de distribución de probabilidad es F(x)
La derivada de f(x) se denomina función de densidad de
probabilidad y los valores x para los cuales f(x) > 0 son el dominio
de la variable aleatoria x.
Las Figuras 4.5a y 4.5b son la representación esquemática de la función de
densidad de probabilidad (fdp) y función de distribución de probabilidad (fd).
En la figura 4.5b, 0.82 es la probabilidad de tener eventos iguales o menores
que xi.
La mayor parte de las variables hidrológicas son continuas y se tratan
como tales o se las hace discretas en función de determinados intervalos
de clase para obtener histogramas de frecuencias relativas o absolutas
para intervalos de clase seleccionados.
Los caudales de un río de régimen permanente o las temperaturas de
una estación nivológica, son variables continuas que se pueden tratar
como discretas, si en el primer caso se consideran los caudales medios
diarios o en el segundo las temperaturas medias cada seis horas.
Cuando se trata con series de valores extremos, máximos o mínimos
seleccionados de una muestra o registro histórico de un río, estas se
pueden analizar mediante el uso de métodos especiales: distribuciones
de probabilidad de tipo I, II y III.
• Gumbel estudió en detalle la I, conocida como “distribución Gumbel”.
• La II se la conoce como “distribución tipo Cauchy o Frechet” y,
• la III “distribución Weibull”.
En estas distribuciones, de importancia en diseño hidrológico, los valores
altos se les asocia a crecidas y los bajos a sequías o déficit hídrico, con
sus consecuencias de tipo económico, social y de riesgo.
En la curva experimental de distribución de frecuencias acumuladas se
deben definir, además, límites de confianza a ambos lados de la curva de
frecuencia que enmarcan una banda de confiabilidad. Dichos límites,
definen áreas de probabilidad acumulada a ambos lados del promedio de
una distribución supuesta en función de la muestra de datos, donde se
puede esperar su valor correcto. Con dichos límites se pueden trazar las
bandas o límites de confianza que permiten el control de la(s) variable(s)
analizada(s). El análisis de regiones homogéneas, mejoran la estimación de
estos límites.
El factor más significativo que afecta esta banda, es el grado de confianza
que se desee establecer. Se usa frecuentemente el 95%, pero valores
entre 70% y 95% son comunes en el diseño hidrológico.
• El tamaño de la muestra con la que se computó la curva de frecuencia,
afecta el ancho de la banda. A mayor tamaño de muestra, disminuye el
intervalo.
• La probabilidad de excedencia afecta la amplitud del intervalo; el
intervalo es menor para valores promedios y se hace mayor en las
puntas (probabilidades mayores y menores).
• El coeficiente de asimetría afecta el intervalo de confianza. La asimetría
afecta el error estándar, por lo tanto el ancho de la banda aumenta con
el aumento del valor absoluto de la asimetría.
Estos factores, se debe tener en cuenta porque puede variar la estimación
de los caudales o lluvias de diseño.
Distribución normal
La distribución normal (Gaussiana) surge del teorema del límite del valor
central, el cual establece que una variable aleatoria x está normalmente
distribuida con el promedio μ y la desviación estándar σ. La función de
distribución de probabilidad (frecuencia acumulada) proporciona la
probabilidad de que X sea menor o igual a x así:
Esta integral es el área bajo la curva de campana que se muestra
en la siguiente figura, la cual tiene un valor igual a la unidad. Es
simétrica respecto a la media y se extiende de menos infinito a
más infinito. Dado que en hidrología (como el caso de caudales de
ríos) raramente se pueden definir valores negativos y por lo
general la distribución de los datos no es simétrica alrededor de la
media, el uso de la normal es limitada.
La función de densidad de probabilidad está dada por:
Donde x es el valor de la variable, µ es el valor medio de la variable y σ la
desviación estándar. Al ser simétrica respecto a la media, la media, la
moda y la mediana son iguales y la asimetría es cero.
La distribución normal, especialmente la estándar, ocupa una posición
destacada en la teoría de la probabilidad sirviendo de referencia y
comparación con otras distribuciones,
La práctica hidrológica indica que la distribución normal ajusta
razonablemente bien registros extensos de lluvias anuales, así como las
descargas anuales de los ríos. Por lo contrario, para lluvias y caudales
medios mensuales, diarios o crecidas no ajusta bien.
Las áreas bajo la curva normal tipificada para valores de Z
especificados en doble entrada (valores de para diferentes
valores de z) se presenta en tablas (Spiegel, 1970; McCuen, 1998)
Ejemplo 4.11
Dado el promedio y la desviación estándar de los datos de lluvia en enero
en una localidad de x = 41.28mm y σ = 6.49mm, suponiendo que la
distribución es aproximadamente normal, determinar:
a) Probabilidad de tener menos de 45mm en cualquier año en enero P (X
< 45.00)
b) Probabilidad de tener entre 43 y 45 mm de precipitación en cualquier
mes de enero P (43.00 < x < 45.00)
c) Probabilidad de tener menos de 35mm P (X > 35.00)
d) Probabilidad de tener exactamente 35mm de precipitación en cualquier
mes de enero P (X ≥ 35.00)
Ejemplo 4.12
Sobre la base de los datos de Portola California, estime los valores promedio de
precipitacion (en pulgadas) y la desviación estándar para determenar la probabilidad
de los siguientes datos, suponiendo que la distribución es aproximadamente normal:
a) Probabilidad de tener menos de 0,05 pulgadas en cualquier año P (X < 0,05)
b) Probabilidad de tener mayor 7,99 pulgadas de precipitación P (x > 7,99)
c) Probabilidad de tener entre 0,7 y 1,0 pulgadas de precipitación en cualquier
mes del período de análisis P (0,7 < x < 1,0)
d) Probabilidad de tener exactamente 0,65 pulgadas de precipitación en cualquier
mes de del periodo analizado (X ≥0,65)
Ejemplo 4.13
Sobre la base de los datos de Mendoza, Argentina estime los valores promedio de
caudal (m3/s) y la desviación estándar para determinar la probabilidad de los
siguientes datos, suponiendo que la distribución es aproximadamente normal:
a) Probabilidad de tener menos de 157 m3/s cualquier año P (X < 157)
b) Probabilidad de tener mayor 387 m3/s de caudal P (x > 387)
c) Probabilidad de tener entre 96 y 111,0 m3/ de caudal en cualquier mes del
período de análisis P (96 < x < 111)
d) Probabilidad de tener exactamente 225 m3/s de caudal en cualquier mes de del
periodo analizado (X ≥ 225)
Ejercicio 4.12
Basado en el promedio y la desviación estándar de los
datos de lluvia anuales de la Tabla 1 de la estación de
Iquique, Chile, y suponiendo que la distribución es
aproximadamente normal, determinar:
a. ¿Cuál será la probabilidad de Probabilidad de tener
menos de 19,7 mm en cualquier año en enero P (X < 19,7)?
b. ¿Cuál será la probabilidad de tener entre 97,9 y
145,4 mm de precipitación en cualquier mes de enero P
(97,9 < x < 145,4)?
c. ¿Cuál será la probabilidad de tener menos de 101,4
mm P (X < 101,4)?
d. ¿Cuál será la probabilidad de tener mayor de 201,9
mm P (X >A 201,9)?
Los datos meteorológicos de algunas estaciones no registran información en
ciertos años o meses por diferentes causas, por lo que se opta por interpolar para
no incurrir en errores sistemáticos al momento en el que se vaya a hacer las
proyecciones; casos similares ocurren con otras estaciones.
Es así que se utiliza la siguiente fórmula para obtener los datos faltantes
Donde:
x = año del que se quiere conocer el valor
x1 = año anterior al que se quiere conocer
x2 = año posterior al que se quiere conocer
y1 = límite superior del valor a conocer
y2 = límite inferior del calor a conocer
Distribución lognormal de tres parámetros
La distribución lognormal se puede generalizar para casos en que el límite
inferior de la misma no sea cero, en este caso se introduce un tercer
parámetro que lo sustituya (x-β). La función de densidad de probabilidad
toma la forma:
f x
1
exp
ln x y
2
x y 2 2 2
y
Donde β es el límite inferior, x la variable. Si el límite inferior, β, se conoce
a priori, la variable x, se reemplaza por (x-β) y se procede como en la
lognormal de dos parámetros. Cuando el límite inferior no se conoce, este
se determina por los métodos de estimación de parámetros descritos más
adelante.
La distribución lognormal se usa corrientemente en hidrología para
variables como precipitación, caudal y otras medidas desde base cero,
cuyo límite superior es desconocido.
Aplicaciones frecuentes en diseño hidrológico
Si una variable hidrológica x se obtiene por medio de una muestra de una
población, el procedimiento común en estadística, es primero seleccionar
la función de distribución que mejor ajuste.
Esta selección se hace mediante la experiencia adquirida en el tratamiento
de la misma variable, en otros lugares o situaciones conocidas (caudales de
los ríos, lluvias en un lugar) o también por consideraciones físicas (régimen
hidrológico, condiciones meteorológicas) o simplemente por ensayo y error.
DATOS ATÍPICOS (OUTLIERS)
Al analizar los datos de un evento (lluvias, caudales) para realizar
curvas de frecuencia y graficar los datos, es frecuente encontrar puntos
que se separan en forma más o menos sensible de la línea media de
frecuencias. Estos datos pueden ser altos o bajos o ambos,
consecuentemente, su inclusión sin un análisis previo puede llevar a
una curva de frecuencias
distorsionada con relación a la que la muestra podría indicar. Un outlier
es un “Evento extremo o dato puntual que se separan de la tendencia
general de la muestra”.
En realidad, el análisis es primeramente subjetivo, un análisis de
consistencia de los datos resulta útil, por lo menos para separar datos
dudosos provenientes de errores de medición. Una investigación, por
ejemplo de un invierno con fuerte acumulación de nieve, seguido de
altas temperaturas en primavera y verano, puede ser una causa
natural, que aclare el concepto del dato registrado o lluvias
antecedentes que hayan saturado el suelo, seguido de fuertes lluvias
que producen altos caudales en un río de régimen pluvial o pluvionival.
Los datos dudosos altos pueden también deberse a factores naturales
no meteorológicos como lo son la rotura de diques glaciarios o diques
Análisis de Correlación y Análisis Regionales
Los análisis de correlación con el objeto de transferir información entre dos
puntos de una cuenca hidrográfica, donde la misma variable ha sido
registrada, o entre varias variables observadas simultáneamente
constituyen una práctica hidrológica de uso frecuente.
Igualmente esta práctica se utiliza para completar datos perdidos en series
hidrológicas o para la predicción de los valores de una variable en función
de otros parámetros o variables medidos u observados.
Correlaciones simples y múltiples
Es una antigua práctica usada en hidrología y consiste en el proceso de
establecer la asociación entre dos o más variables al azar, donde la
variación de una de ellas explica (en parte) la variación de la otra. Si
existen solamente dos variables (x , y) es una correlación simple, si hay
varias variables independientes (x1, x2, .....xn) es una correlación múltiple.
Ejemplos típicos de correlación simple en hidrología son la asociación entre
los datos de caudales medidos de dos estaciones de aforo de un mismo río
para completar datos faltantes, o la asociación entre caudales de dos ríos
de una región hidrológicamente homogénea.
Para el caso de correlación múltiple, un ejemplo típico en hidrología es
correlacionar las descargas medias mensuales de un río con precipitación
y parámetros geomorfológicos de la cuenca.
Coeficiente de correlación
El coeficiente de correlación es la forma más frecuente de expresar el grado
de asociación entre dos variables:
N N
x i x y i y x i yi N x y
r i 1
i 1
N x y N x y
Donde N es el número de pares de observaciones x (xyi, yi); , ,σx ,σy,
valores promedios y desviaciones estándar de los valores observados de
x e y, respectivamente.
De igual forma, una medida de asociación de varias variables una
dependiente y otras independientes se expresa como el “coeficiente de
correlación múltiple” e indica, el grado de diferencias entre los valores
observados y los estimados.
El valor del coeficiente de correlación, r, oscila de +1 a –1; cuando r es
positiva indica correlación directa (a un aumento de x, corresponde un
aumento de y) y si es negativo es correlación inversa.
Frecuentemente, se usa, el valor de r2, llamado “coeficiente de
determinación”. Es una medida de la diferencia entre la varianza
(σ2) de los valores observados y la varianza de los valores
estimados por la línea de regresión.
A mayor valor de r2, menor es esa diferencia (mejor es la
regresión). Así si r = 0.8; r2 = 0.64. Este valor indica que 64 por
ciento de la varianza, está explicada por la regresión.
El cálculo de correlación y regresión incluye los siguientes pasos:
1. Seleccionar una posible función de correlación, simple o
múltiple, lineal o no lineal.
2. Estimar los parámetros estadísticos que miden el grado de
correlación (r2).
3. Estimar los parámetros de la ecuación de regresión.
4. Control de significancia -trazado de límites de confianza
alrededor de la línea de regresión.
En correlaciones simples, el ajuste a una línea , es una suerte de
aplicación de conceptos matemáticos (como el uso de funciones
semilogarítmicas o doble logarítmicas). En correlaciones múltiples
eso no resulta tan directo, pero el uso de programas estadísticos
Cuenca hidrológica
La cuenca es aquella superficie en la cual el agua precipitada se transfiere
a las partes topográficas bajas por medio del sistema de drenaje,
concentrándose generalmente en un colector que descarga a otras
cuencas aledañas, o finalmente al océano. La cuenca hidrológica, junto
con los acuíferos, son las unidades fundamentales de la hidrología.
La cuenca hidrográfica es un sistema que presenta como principal entrada
la lluvia, y como salidas el caudal, la evapotranspiración, el flujo
subsuperficial y la percolación. Las tres últimas son salidas que tienen
poco valor en el marco de una creciente súbita, pero son importantes en
relación al flujo base y en la consideración de modelos de simulación
continua.
Desde el punto de vista de su salida existen dos tipos de cuencas:
endorreicas (cerradas) y exorreicas (abiertas).
a) En el primer tipo, el punto de salida se ubica dentro de los límites de la
cuenca y generalmente es un lago.
b) En el segundo tipo, el punto de salida se localiza en los límites de la
cuenca y a su vez la descarga se vierte en una corriente o en el mar.
La divisoria es la línea topográfica que separa superficialmente dos
cuencas hidrográficas o sistemas de drenaje independiente en dirección y
sentido, cuyas salidas no necesariamente coinciden en un río común
determinado.
Aparte de la divisoria topográfica o superficial, existe la divisoria freática o
subterránea. Esta última establece los límites de los cuerpos de agua
subterránea, de donde se deriva el caudal base de la misma cuenca. Las
dos divisorias difícilmente coinciden. La divisoria freática varía con la
posición del nivel freático. El nivel freático, es el nivel que determina el
agua subterránea y sobre el que actúa la presión atmosférica. El caudal
base es el caudal dado por el nivel freático.
Se acostumbra definir el área de drenaje de una cuenca de acuerdo con
su divisoria topográfica.
Clasificación de los cursos de agua
Con base en la constancia de la escorrentía, los cursos de agua se
pueden dividir en:
a. Perennes:
i. Corrientes con agua permanente
ii. El flujo subterráneo mantiene una alimentación continua
produciendo un flujo base que es permanente, salvo situaciones
extremadamente secas.
b. Intermitentes:
ii. Corrientes que presentan un flujo base sólo en estaciones de
lluvia.
iii. El nivel de agua subterránea supera el nivel del lecho del río en
la época lluviosa. En épocas de lluvias escasas o nulas ese
nivel baja manteniendo un flujo subterráneo.
c. Efímeros o ríos secos
i. Carecen generalmente de flujo base. Los escurrimientos
superficiales se generan solamente ante la presencia de una
lluvia (generalmente de alta intensidad) sobre la cuenca. En
zonas áridas, por ejemplo, en los torrentes se producen
crecientes súbitas.
Red de Drenaje
La red de drenaje está constituida por el río principal y sus tributarios.
Adicionalmente existe una orden de drenaje. Esta orden refleja el grado
de ramificación o bifurcación dentro de una red de drenaje. Puede
Determinarse de acuerdo a criterios expuestos por diferentes autores,
entre ellos se tiene:
a. Horton-Strahler: consiste en atribuirle el número de orden a los
canales de la siguiente manera:
• Corrientes de primer orden: Pequeños canales que no tienen
tributarios.
• Corrientes de segundo orden: Cuando dos corrientes de primer orden
se unen.
• Corrientes de tercer orden: Cuando dos corrientes de segundo orden se
unen.
• Corrientes de orden n + 1: Cuando dos corrientes de orden n se unen.
a. Shreve: es otro esquema de organización planimétrica de la red
hidrográfica en la que se obtiene un arbol de bifurcación como el que
se muestra en la Figura donde el orden o “magnitud” de un segmento
de corriente formado en una unión, es la suma de las magnitudes de
los dos tributarios, asi:
• Corrientes de primer orden: Pequeños canales que no tienen tributarios.
• Corrientes de segundo orden: Cuando dos corrientes de primer orden se
unen.
• Corrientes de tercer orden: Cuando se unen una corriente de segundo
orden y una de primer orden.
• Corrientes de orden n + m: Cuando se unen dos corrientes de orden n y
m.
Estudios Hidrológicos
Los factores que intervienen en los estudios hidrológicos son muy diversos:
topografía, geología, edafología, climatología, vegetación, etc. La influencia
de estos elementos no puede ser reducida a expresiones puramente
matemáticas, pero el estudio de ciertas relaciones puede dar una idea
cualitativa del problema.
Las relaciones existentes entre los elementos hidrológicos y los físico-
geográficos son aleatorias. Así, un parámetro cualquiera del régimen
hidrológico es función de varios elementos físico-geográficos.
Los principales problemas que se presentan en la aplicación de este
método son los siguientes:
• Elección, entre las diversas relaciones posibles, de aquélla o aquéllas
que tengan mayor sentido físico.
• Definir en función de la variación de las características físico-
geográficas, la afinidad hidrológica entre cuencas comparables. Esta
afinidad dependerá, fundamentalmente, de los siguientes aspectos:
pluviometría, clima, geología, topografía y vegetación.
• Obtener las relaciones entre los elementos físico geográficos y los
diversos parámetros hidrológicos y los posibles cambios de estos, si se
modificaran las características físico-geográficas iniciales.
Escalas de trabajo
Para el estudio y determinación de los parámetros geomorfológicos se
requiere de la información cartográfica de la topografía, del uso del suelo y
de la permeabilidad de la región en estudio. Los planos para estos análisis
son usados en escalas desde 1:25.000 hasta 1:100.000, dependiendo de
los objetivos del estudio y del tamaño de la cuenca en cuestión.
Parámetros Geomorfológicos Básicos
Los parámetros geomorfológicos básicos para establecer una afinidad
hidrológica entre cuencas comparables son: área, perímetro, altura
máxima, mínima y desnivel, índice de compacidad, radio de
elongación, curva hipsométrica, curva de frecuencias altimétricas,
altitud media, longitud del cauce principal, pendiente media del cauce
principal, pendiente ponderada del cauce principal, rectángulo
equivalente, índice de pendiente, pendiente, pendiente media total o
pendiente neta total, coeficiente de masividad o de Martone,
coeficiente orográfico.
Área de la cuenca
La delimitación exacta de las cuencas se efectúa sobre los planos
correspondientes a las restituciones planialtimétricas a escala
adecuada. De acuerdo a los órdenes de magnitud de las escalas de los
planos base en trabajos de hidrología, suelen considerarse como
suficientes las escalas de trabajo recién mencionadas en todos los
casos se determina primero la línea de contorno de cada cuenca
coincidente con la divisoria topográfica.
Perímetro
Sobre los mismos planos se mide el contorno de cada cuenca. En la
medición del perímetro, en los casos en que la divisoria sigue una
trayectoria muy sinuosa, se sigue el criterio, a los efectos de la medición,
de interpolar una línea sustituyendo a la auténtica divisoria. Con ello las
características de la cuenca no se alterarán fundamentalmente, el área no
se modifica ya que se puede suponer que está compensada y en cuanto al
perímetro sufre un cierto acortamiento. En definitiva, la forma de la cuenca
en su aspecto hidrológico no se altera por esta sustitución y el valor que se
adopta no es el resultante de recorrer todo el contorno rigurosamente, sino
un contorno simplificado de su forma.
Altura máxima, mínima y desnivel
En general la elevación máxima, en conjunción con la altitud media, es un
índice de la medida en que deben elevarse las masas de aire para pasar
sobre la cuenca.
La altura máxima se obtiene por lectura directa en las planimetrías, de la
cota del cerro de mayor altura, ubicado dentro de la cuenca o en su
contorno. La altura mínima se determina en correspondencia con la cota
del cauce principal en la sección de control. El desnivel corresponde a la
diferencia entre la altura máxima y la altura mínima.
Por lo general, en la mayoría de las fórmulas para el cálculo del tiempo de
concentración de una cuenca intervienen parámetros derivados de las
características físicas del cauce principal, como lo son:
• Longitud del cauce principal. Se determina por medición directa de la
longitud del cauce más importante de cada cuenca. En la elección de
dicho cauce, se tiene en cuenta en cada caso, tanto la longitud del
mismo, como su desnivel, buscando siempre el curso que presenta en
lo posible, el máximo para ambos valores.
• Pendiente media del cauce principal. Se calcula directamente por la
media aritmética, considerando las elevaciones extremas del cauce
principal.
• Pendiente ponderada del cauce principal. Para su determinación se
grafica el perfil longitudinal del cauce principal de cada cuenca,
trazando luego la recta de compensación, cuya pendiente indica la
pendiente ponderada del cauce.
Rectángulo equivalente
Se suele admitir que una cuenca se comporta, hidrológicamente, de un
modo análogo a un rectángulo que tuviera la misma área y perímetro y, por
tanto, igual índice de compacidad, distribución de alturas curva
hipsométrica, y distribución de terreno por su naturaleza, rocas, cultivos,
etc.
Modelación de Cuencas
Los modelos permiten simular el comportamiento de un sistema real
(prototipo) y obtener mediante la operación del mismo, las respuestas o
salidas a un determinado impulso o entradas al sistema. En hidrología e
hidráulica se usan modelos: físicos, analógicos y matemáticos.
• Los modelos Físicos son una parte importante del diseño hidráulico (
Por ejemplo los modelos de laboratorio de hidráulica).
• Los modelos Analógicos: fueron muy usados para simular flujos
subterráneos. Ejemplos de modelos analógicos los modelos
matemáticos de flujo subterráneo y de transporte de contaminantes
como el modelo “Modflow ” (USGS, 2000).
• Los modelos matemáticos: son cualquier ecuación o algoritmo
matemático que pretenda representar un fenómeno físico. Estos
modelos son más versátiles que los anteriores y pueden fácilmente
cambiar los valores de variables o parámetros.
La dificultad de estos radica en que es generalmente necesario hacer
simplificaciones del fenómeno físico real para lograr su
representación matemática. El potencial de las computadoras y el
hecho de tener cada día mejores datos en tiempo – espacio, hacen de
los modelos matemáticos una herramienta más confiable que se
acerca cada vez más al mundo real.
Las técnicas de análisis estadístico y regionalización resultan importantes
para completar series, extrapolar datos en áreas homogéneas, realizar
análisis de consistencia y corregir errores. En términos generales estos
son los pasos más significativos en los estudios hidrológicos de cuencas.
A partir de los
años 80, el
intenso desarrollo
de sensores
remotos y
tecnología
espacial ha
proporcionado a
los hidrólogos la
oportunidad de
densificar la
información,
generalmente
dispersa, agilizar
y facilitar el
conocimiento
espacial de las
cuencas con
menores
tareas de
campaña.
Otra técnica que ha producido un verdadero cambio en el procesamiento y
manejo de datos geográficos es el desarrollo de los “Sistemas de
Información Geográfica” (SIG), facilitando la implementación, calibración,
evaluación y comparación de modelaciones de cuencas. El modelo
HEC-Geo RAS (HEC, 2009) es un claro ejemplo de uso práctico de los SIG
en los modelos hidráulicos.
La variabilidad espacial de las condiciones físicas, vegetación y uso del
suelo, precipitación, movimiento de las tormentas, se definen ahora con el
uso de estas técnicas, lo cual facilita la calibración de los modelos.
Clasificación de Modelos
Los modelos determinísticos son aquellos en los que las funciones
que relacionan las entradas y las salidas, definen el comportamiento del
sistema sin que se tenga en cuenta ley o distribución de probabilidad
alguna. Dada una función de entrada y sus variables y parámetros se
obtiene una función de salida perfectamente definida.
Los modelos estadísticos/estocásticos son modelos en los cuales,
las relaciones entre las variables están gobernadas por leyes de
probabilidad, tanto en relación con su magnitud (correlaciones) como en
su secuencia en el tiempo (modelo estocástico de generación de series
de tiempo).
Los modelos de optimización son modelos que optimizan una función
objetivo, sujeto a un cierto número de restricciones o condiciones de
borde. Los más usados en hidrología son los de programación lineal y
programación dinámica.
Para identificar un modelo de simulación hidrológica, se debe enmarcar
el mismo en todo lo expresado: así por ejemplo el modelo hidrológico
HEC-1 o el HMS, en su rutina de precipitación-escorrentía se clasifica
como determinístico, lineal, empírico, de parámetros concentrados y de
eventos.
Hidrograma
El hidrograma es la representación
gráfica del caudal, Q, o volumen de
agua que pasa por una sección en
determinado tiempo, T. En el
hidrograma de una creciente, se
pueden distinguir las siguientes
componentes:
• Caudal o escorrentía directa, QD es
aquella parte de la creciente que
escurre inmediatamente como
escorrentía superficial por efecto
de la lluvia neta o efectiva.
• Caudal o flujo base, QB, es el
caudal de un cauce que se debe al
aporte de aguas subterráneas o a
la precipitación que se infiltra.
• Tiempo de retraso, TR, es el tiempo
que transcurre entre el centro de
gravedad del hietograma de la
lluvia y el centro de gravedad del
hidrograma de la creciente.
• Tiempo de concentración, Tc, es el tiempo que transcurre para que la
partícula de agua del punto más alejado llegue a la sección de control
o punto de concentración (estación donde se analiza la creciente).
• Tiempo de pico, Tp, es el tiempo comprendido entre el inicio de la
creciente y el caudal máximo.
• Tiempo base, Tb, es la duración de la creciente.
• Precipitación efectiva, Pe, es la porción de la precipitación que
produce la escorrentía superficial.
• Precipitación total, PT, es la lámina caída en una tormenta sobre la
cuenca.
• Perdidas, Ia, son aquellas partes de la precipitación que no aportan a
la formación de la escorrentía superficial.
• Caudal máximo, Qmax, es el pico del hidrograma.
• Curva ascendente o de concentración, es la línea del hidrograma
precedente al caudal máximo. Depende fundamentalmente de la
intensidad, ubicación y distribución de la tormenta sobre la cuenca.
Se ha observado una incidencia notable de las condiciones de
humedad del suelo por efecto de la precipitación antecedente.
3.
4.
5. La cuenca es aquella superficie en la cual el agua precipitada se transfiere a las
partes topográficas bajas por medio del sistema de drenaje, concentrándose
generalmente en un colector que descarga a otras cuencas aledañas, o finalmente
al océano. La cuenca hidrológica, junto con los acuíferos, son las unidades
fundamentales de la hidrología. Defina las categorías del orden de drenaje.
Corrientes de primer orden: Pequeños canales que no tienen tributarios.
Corrientes de segundo orden: Cuando dos corrientes de primer orden se unen.
Corrientes de tercer orden: Cuando dos corrientes de segundo orden se unen.
Corrientes de orden n + 1: Cuando dos corrientes de orden n se unen.