Académique Documents
Professionnel Documents
Culture Documents
FACULTAD DE CIENCIAS
DEPARTAMENTO DE FISICA, METEOROLOGIA Y ING. AMBIETAL
Alumno :
Ciclo : 2017 – II
Correlación de Pearson
Medida de la relación lineal entre dos variables aleatorias cuantitativas. Es
independiente de la escala de medida de las variables.
Correlación de Spearman
Es una medida de la correlación (la asociación o interdependencia) entre dos
variables aleatorias continuas.
Varianza
Es una medida de dispersión definida como la esperanza del cuadrado de la
desviación de dicha variable respecto a su media. O en pocas palabras, es la media
de los residuos al cuadrado.
Bias
Mide la correspondencia entre el promedio de pronósticos y el promedio de
valores observados.
Hit Score
Es la relación de pronósticos correctos al número de veces que este evento ha
ocurrido.
IV. METODOLOGIA
4.1 Data
Para este presente estudio se utilizaron datos históricos de precipitación de 15 estaciones
que fueron extraídos de la página del SENAMHI (Servicio Nacional de Meteorología e
Hidrología) y estos a su vez se utilizaran con un periodo de 24 años (1990 - 2013), y
con un umbral de datos faltantes de 20%.
4.2 Área de estudio
La data que se utilizó se encuentra en su mayoría en la costa norte del Perú, en las
regiones de Tumbes y Piura, conformadas por las siguientes estaciones:
4.3 Procedimiento
En primera instancia se recurrió a la agrupación trimestral de los datos, para que
posteriormente se realice un AED (análisis exploratorio de datos) con la finalidad de
observar si este tiene una cantidad de datos faltantes evaluada con respecto al umbral, que
para este informe será de 20%, luego de este análisis se tendrá que completar los datos
recurriendo al método de completación por regresión múltiple lineal. Ya completados los
datos para las estaciones elegidas se tendrá que proceder con el análisis en el programa
de Climate Predictability Tool (CPT) donde se recurrirá a las herramientas de Análisis de
Correlación Canónica (ACC) y Análisis de Componentes Principales (ACP),
seguidamente se llevó a cabo una comparación de los resultados de cada proceso con la
finalidad de generar un pronóstico el cual solo se tomara en cuenta un periodo de los 2
últimos años del resultado. Posteriormente se hará un análisis del modelo mediante los
atributos que poseen (Hit score, ROC, Coef. Pearson, entre otros), con la finalidad de
saber si nuestro modelo predictor fue bien utilizado para la data de las estaciones
utilizadas.
V. RESULTADOS
- Estación de Morropon.
VI. DISCUSIONES
Como se observa en los resultados obtenidos a través del CPT, las observaciones
ocurridas son muy diferentes a las pronosticadas en un área específica de la gráfica
que se encuentra en la segunda figura de los resultados para cada estación. Siendo
estas (Morropon y Pananga) unas estaciones que están ubicadas en la zona de la costa
norte del Perú donde generalmente se encuentran expuestas al fenómeno del niño o
de la niña, que hace que las características meteorológicas cambien de manera
considerable, llegando a ser muy diferentes a las pronosticadas.
Aunque los indicadores estadísticos son una referencia técnica, se debe entender lo
que significan, es por esto que el hecho de que el coeficiente de Pearson y el de
Spearman sean negativos ratifica lo mostrado en las gráficas, además estos indican si
la distribución de los datos es lineal o monótica respectivamente, y para este caso las
estaciones presentadas tienen bajo el coeficiente lo cual indica que necesariamente no
se distribuyen con normalidad a una lineal o monótica. De las medidas categóricas,
para la estación de Morropon se tiene un valor moderado del Hit Score 50% al igual
que el Hit Skill Score de 25% los cuales indican que el modelo de pronostico tiene
una aceptación media para la predicción de normales – altas con un 56% de seguridad
de pronóstico. Por otro lado, para la estación de Pananga se tiene bajos valores de HS
(28.57%) y HSS (-14.29%) estos reflejan el mal uso del modelo para estos valores de
precipitación.
Alteraciones por errores de toma de datos o por fenómenos meteorológicos hacen que
esto ocurra, pero nunca se va a tener un valor de 1 en las correlaciones antes
mencionadas ya que el clima es casi impredecible al 100%, porque el ser humano aún
no llega a tener la capacidad de saber o pronosticar sin algún tipo de dudad lo que
pueda pasar climáticamente.
Según la universidad de Piura, para un trimestre EFM, el valor de correlación de
Pearson debería de ser aproximadamente -0.0463, con esto se verifica que, en los
meses de verano, los valores observados con los valores pronosticados no tienen
mucha relación.
VII. CONCLUSIONES
- El CPT aun muestra una confiabilidad ligeramente mayor al 50% para a estación
de Morropon, pues va presentando un buen comportamiento en años normales.
- El modelo de pronostico climático fue aplicado mejor para la estación de
Morropon en comparación con la estación de Pananga.
- Las diferencias entre los cálculos del ACC y el ACP fueron casi nula, por ende,
establecer un cálculo extra para el pronóstico seria innecesario.
- La zona de la costa norte del Perú tiende a presentar una no similitud entre lo
observado con lo pronosticado para la mayoría de estaciones, pero estos a su vez
son ligeramente afectados por la topografía accidentada que se tiene para
algunas estaciones meteorológicas e hidrológicas en la región norte del Perú.
- Los fenómenos como el niño o la niña alteran considerablemente la calidad del
pronóstico.
VIII. BIBLIOGRAFIA
Bibliografía
Mason, S. (2016). Climate Predictability Tool. Switzerland: Columbia University.