Blogs
CUATRO TÉCNICAS PARA SELECCIONAR LA DISTRIBUCIÓN DE PROBABILIDAD DE MEJOR AJUSTE PARA EL ANÁLISIS DE DATOS DE PRECIPITACIÓN MÁXIMA ANUAL EN MÉXICO
- 28 noviembre, 2023
- Categoria: Noticias
Existen diversas funciones de distribución de probabilidad para el análisis de frecuencias, pero ninguna es universalmente aceptada como la mejor. Algunas son: normal, log-normal, Gumbel, Weibull, General de Valores Extremos (GVE), Pearson y Log-Pearson tipo 3. En México y Latinoamérica, la función de distribución de Gumbel ha sido ampliamente utilizada como una distribución para el análisis de eventos extremos.
METODOLOGÍA
Información climatológica. Los datos utilizados en este trabajo fueron los registros de precipitación máxima anual de 24 horas obtenidos de la base de datos CLICOM, de 21 estaciones meteorológicas, las cuales están ubicadas en cinco estados de la república mexicana con tres climas diferentes. La longitud de los registros varía desde 32 hasta 89 años para el periodo de 1923 a 2012 (ver Tabla 1).
Distribuciones de probabilidad consideradas. Las funciones de distribución de probabilidad usadas en el análisis de frecuencias de las series de precipitaciones máximas anuales fueron la log-gamma, Gumbel, log-logística, log-Pearson tipo 3 (LP3), general de valores extremos (GVE) y logística-generalizada. Estas distribuciones fueron seleccionadas por las razones siguientes: las distribuciones LP3, GVE y logística generalizada son distribuciones de tres parámetros usadas comúnmente en hidrología. La distribución LP3 fue adoptada por las agencias federales de los Estados Unidos y Australia para el análisis de frecuencia de caudales, mientras que en el Reino Unido la distribución logística generalizada fue seleccionada para este mismo fin.
La distribución GVE, así como sus casos especiales, son utilizadas ampliamente en el ámbito hidrológico. Las otras tres distribuciones son distribuciones de dos parámetros, las cuales están relacionadas con alguna de las distribuciones de tres parámetros seleccionadas. La distribución log-gamma pertenece a la misma familia que la LP3; la Gumbel pertenece a la familia de la GVE; y la log-logística a la familia de la logística generalizada.
Estimación de parámetros. Para cada serie de precipitación máxima anual, se ajustaron las seis distribuciones consideradas. Es decir, se estimaron los valores de los parámetros de estas distribuciones a partir de las observaciones de cada serie. Los parámetros de las distribuciones Gumbel, GVE, log-logística y logística generalizada se estimaron por el método de los momentos L, mientras que los parámetros de la distribución log-gamma y de la LP3 se estimaron usando momentos convencionales.
Criterios de selección de modelos Para determinar cuál de las distribuciones consideradas era la más apropiada para modelar las observaciones de precipitación máxima anual de cada estación, se utilizaron las pruebas de error estándar de ajuste (EEA) y Kolmogorov-Smirnov (KS), así como el Criterio de Información Bayesiano (CIB) y el Criterio de Información de Akaike (CIA).
El EEA se define como:
Donde: xi son las observaciones ordenadas de menor a mayor; i es el número de orden de la observación xi; 𝑥̂𝑖=𝐹−1(𝑖𝑛+1); F (xi) es la función de distribución teórica; n es el número de observaciones; y p el número de parámetros de la distribución ajustada.
El estadístico de KS se define de la siguiente manera:
Donde: xi son las observaciones; i es el número de orden de la observación xi; F(xi) es la función de distribución teórica; y n es el número de observaciones.
El CIA se define mediante la ecuación:
Donde: 𝐿𝑗(𝜙̂)=Π𝑓𝑗(𝑥𝑖,𝜙̂)𝑛𝑖=1 es la función de verosimilitud, evaluada en 𝜙=𝜙̂, que corresponde al estimador del vector de parámetros 𝜙; 𝑓𝑗 es la j-ésima función de distribución teórica considerada; y 𝑝𝑗 es el número de parámetros de dicha función. Para el caso particular de este trabajo, j=1,2,…,6, ya que las distribuciones teóricas fueron seis.
El CIB, por su parte se define como
En ambos casos, se selecciona la función de distribución 𝑓𝑗 para la cual el correspondiente criterio de información haya tenido el valor más pequeño.
Tanto el CIA y como el CIB toman en cuenta el principio de parsimonía, es decir, entre dos modelos con un nivel comparable de ajuste, seleccionan el modelo más sencillo. La forma en que toman en cuenta este principio es por medio del segundo término de las ecuaciones (3) y (4), que penaliza el número de parámetros de una distribución.
Estimación de cuantiles. Para las distribuciones de mejor ajuste según los criterios aplicados, se estimaron los cuantiles correspondientes a los periodos de retorno de 2, 5, 10, 20, 50, 100, 200, 500 y 1000 años. Como las formas inversas de las distribuciones Gumbel, GVE, log-logística y logística generalizada se pueden definir analíticamente, los estimadores 𝑥̂𝑇 de los cuantiles resultan de invertir las respectivas funciones de distribución de probabilidad, ecuaciones (5) a (8), respectivamente. Las formas inversas de las distribuciones log-gamma y LP3 no se pueden definir analíticamente. Para estos casos se utilizó el software Scilab que incluye una función inversa de la distribución gamma, mediante la cual se obtienen los cuantiles de dicha distribución. Scilab calcula esta función inversa usando el algoritmo descrito por [34]: Dicha función inversa sirvió como base para calcular los cuantiles de las distribuciones log-gamma y LP3.
Para obtener más información, complementar con información de la fuente.
FUENTE:
Flowers-Cano R.S. (). COMPARISON OF FOUR TECHNIQUES TO SELECT THE PROBABILITY DISTRIBUTION OF BEST FITTING FOR THE ANALYSIS OF DATA OF ANNUAL MAXIMUM PRECIPITATION IN MEXICO. JEEOS. http://revistas.ujat.mx/index.php/JEEOS/index