Vous êtes sur la page 1sur 28

Climate Predictability Tool (CPT)

Ousmane Ndiaye and Simon J. Mason


ousmane@iri.columbia.edu

International Research Institute for Climate and Society The Earth Institute of Columbia University

SURVOL DU LOGICIEL
Le Climate Predictability Tool (CPT) est un logiciel sous windows qui fait : Prvision saisonnire climatique Validation de modle Vrification de modle probabilistique Mise jour de la prvision En quatre diffrentes langues Options dAnalyse statistique : Analyse en Corrlation Canonique (CCA) Rgression en Composante Principale (RCP) Regression Lineaire Multiple (RLM) GCM validation (GCM) Probabilistic Forecast Verification (PFV) Pages daide sur plusieurs rubriques en format HTML Option de sauvegarde des sorties en fichier ASCII ou sous format graphique

CHARGER LES FICHIERS DE DONNEES

Utiliser le navigateur pour charger les deux fichiers dentre : 1. Variables Explicatives (X) et 2. Variables Rponse (Y)

CHOIX D`UNE ANALYSE

On commence d`abord choisir lanalyse faire

FORMAT DES FICHIERS DENTRE SUR CPT


Fichier de type station : Ce type de fichier contient sur les trois premires lignes : 1) Nom des Station (sans espace; 16 caractres) 2) Latitude (en degr) 3) Longitude (en degr) Ensuite viennent les donnes Anne (premire colonne) et les Donne (les donnes manquantes doivent tre remplace par la mme valeur, -9999 par exemple) Mots-cls : STN, LAT, LONG

FORMAT DES FICHIERS DENTRE SUR CPT


Fichier indice ou sans rfrence : Les donnes sont sans coordonnes (pas de latitude et longitude): Nom de lindice (sans espace; 16 caractres) Anne (premire colonne) Donnes (avec les valeurs manquantes)

Mots-cls :
NAME ou YEAR

FORMAT DES FICHIERS DENTRE SUR CPT

Les fichiers dentre peuvent tre obtenus avec le logiciel Excel en le sauvegardant au format : texte ( separateur : tabulation.

SELECTION DES FICHIERS D ENTRE

Pour slectionner un fichier dentre il faut cliquer sur navigateur.

SELECTION DES FICHIERS D ENTRE

CPT ouvre un navigateur genre windows explorer qui permet de localiser et de charger le fichier de donnes.

SELECTION DES FICHIERS D ENTRE

Pour des donnes en grille ou station, CPT te propose de choisir ton domaine spatial sur lequel seffectuera lanalyse PCR/CCA ou le domaine daffichage des rsultats (Y). On peut utiliser la souris ou taper directement les coordonnes limites du domaine.

SELECTION DES FICHIERS D ENTRE

Ensuite il faut choisir le nombre de modes utiliser dans lanalyse. CPT va chercher la combinaison pour trouver le nombre optimal de modes.

SELECTION DES FICHIERS D ENTRE

Pour des fichiers de type station, CPT utilise par dfaut les coordonnes dans le fichier pour dlimiter la zone nanmoins il y`a une option de redfinir le domaine.

CHOISIR LA PERIODE DAPPRENTISSAGE

Par dfaut CPT commence lanalyse partir de la premire anne dans les fichiers X et Y; mme si ces annes sont diffrentes. On devrait normalement choisir la mme anne en gnral lanne la plus rcente entre les deux fichiers. Faire attention lorsque la saison est cheval sur deux annes comme par exemple les saisons DJF ou JFM. Dans ce cas lanne de dbut du fichier X doit tre dcale dune anne par rapport celle du fichier Y.

CHOISIR LA PERIODE DAPPRENTISSAGE

La taille de la priode dapprentissage (longueur) est spcifie en mettant le nombre danne (49) ainsi que la largeur de la fentre de la validation croise (5) o se fera la validation du modle.

DONNEE MANQUANTES - MISSING VALUES

Si on a des donnes manquantes dans le fichier, CPT offre un menu de remplissage avec plusieurs options : Options => Donnes => Valeurs Manquantes

DONNEE MANQUANTES - MISSING VALUES

Il faut dabord indiquer le code/chiffre qui reprsente une donne manquante (Missing value flag), ainsi on peut : limiter le pourcentage maximum de donne manquante (Maximum % of missing value) au del duquel la station/grille est enleve de lanalyse Aussi pour chaque anne on peut spcifier le pourcentage maximum (Maximum % of missing points de grille) de station manquante au del duquel toute lanne est enleve de lanalyse. Pour remplacer une donne manquante on peut limiter le nombre de station proche utiliser (Number of near-neighbours)

DONNEE MANQUANTES - MISSING VALUES

Pour remplacer une donne manquante on a le choix dutiliser : la moyenne des valeurs existantes (Long-term mean) la mdiane des valeurs existantes (Long-term medians) des donnes alatoires qui ne changent pas le caractre de la srie (Random numbers) par la valeur de la station la plus proche de la mme anne (Best near-neighbours)

SAUVEGARDE DES CHOIX DE LANALYSE

Une fois que les fichiers d`entre slectionns de mme que les choix sur lanalyse il est recommand de sauvegarder ces choix dans un projet pour les appeler plus tard avec le menu : Fichier => Sauver

LANCER LANALYSE

Maintenant on peut commencer lanalyse en allant au menu : Actions => Calculer => Validation Croise

LANALYSE

CPT commence lanalyse et on peut voir les tapes et les procdures doptimisation du modle.

LANALYSE

Optimisation du modle : 1. CPT utilise dabord 1 seule composante principale (mode 1) comme prdicteur pour faire une validation croise et ensuite il calcule un indice de bonne prvision goodness index indiquant la qualit de la prvision en gnral (1 tant la meilleure). Ensuite CPT utilise les modes 1 et 2 pour faire la prvision et calcule nouveau le goodness index, et ainsi de suite jusqu utiliser le maximum de mode (5 modes). 2. A chaque tape CPT compare les goodness indices et retient dans la colonne OPTIMUM le meilleur modle cad celui qui a lindice le plus lev. (voir lexemple ci-dessus avec #4).

RESULTATS

Pour voir les rsultats il faut aller au menu Outils => Validation => Validation Croise : Mesures de Performance : montre les sries prvue et observe sur chaque station et une mesure de performance (corrlation ). Cartes de Skill-scores : montre la performance des modles sur lensemble des stations.

INDICATEURS DINCERTITUDE

Pour avoir des indications dincertitude sur la performance des mesures (corrlation) il faut aller : Outils => Validation => Validation Croise => Bootstrap On a ainsi des limites de confiance (Confidence limites) et la probabilit due au hasard (P-value).

RESULTATS
Valeur prevue

Pour voir les prvisions il faut aller : Outils => Prvisions => Sries : Qui permet de voir la valeur prvue (en croix) Un clique droit sur la carte permet dafficher lintervalle de confiance sur la prvision : Personnaliser => Intervalles de Prvisions

RESULTATS

Probabilit de depasser 300 m3/s prevu en 2011 Probabilit de depasser 300 m3/s dhabitude/climatologie Pour voir il faut aller : Outils => Prvisions => Dpassements : permet de voir la probabilit de dpasser une certaine valeur (cote) pour la climatologie (en rouge) et pour la prvision.

RESULTATS : CARTES PREVUES

Outils => Prvisions => Cartes => Probabilits : montre la probabilit de chaque catgorie chaque point ainsi que la distribution spatiale de la prvision. Sur cet exemple il est clair que la catgorie au dessus de la normale (Above) est la plus probable.

RESULTATS : dans un fichier

CPT offre loption de sauvegarder les rsultats dans un fichier avec le menu Fichier => Rsultats => Rsultats : Les valeurs prvues par la validation croise Hindcasts Les donnes dentree aprs avoir rempli les valeurs manquantes Donnes dEntree Les moyennes et les seuils Climatologies Les composantes principales PCR Results Les prvisions du modle Prvisions

CONCLUSIONS
Pour plus de dtails, lire la page daide sur chaque menu et sur chaque option. Souscrire la liste des utilisateurs pour tre notifi aux mise jour : http://iri.columbia.edu/outreach/software/ Nous aimerions vous entendre. Vos commentaires et vos questions nous aide a amliorer le CPT donc nhsiter pas nous crire : cpt@iri.columbia.edu