gpscope-DT UPS 855

Partenaires

Rechercher

Accueil > Chantiers pemanents hors de France > Calcul automatique des donnÃ©es GPS des stations permanentes

Calcul automatique des donnÃ©es GPS des stations permanentes

par Olivier Charade - 14 juin 2008 - modifié le 20 juin 2008

Contrairement aux donnÃ©es de campagne dont on peut rÃ©server le traitement pour un moment plus propice, le flot de donnÃ©es issues des stations permanentes impose une prise en compte rÃ©guliÃ¨re sous peine d’accumuler un retard qui se chiffre rapidement en plusieurs semaines de temps de calcul ininterrompu. La solution dÃ©crite ici permet d’obtenir quotidiennement des graphiques de sÃ©ries temporelles au fur et Ã mesure de l’arrivÃ©e des donnÃ©es.

La mÃ©thode et les utilitaires dÃ©crits ci-aprÃ¨s sont basÃ©s sur la suite gamit/globk/glorg du MIT.

Une rÃ¨gle de base que je me suis imposÃ©e dans mes dÃ©veloppements a Ã©tÃ© de ne jamais modifier les programmes du MIT, mÃªme si cela semblait parfois plus simple. L’intÃ©rÃªt est de pouvoir suivre les mises Ã jour du MIT sans avoir Ã reporter (et adapter) ces modifications Ã chaque fois.

Une sÃ©curitÃ© quand il s’agit de traitement automatisÃ© est, indÃ©pendamment des procÃ©dures, de crÃ©er un utilisateur dÃ©diÃ© Ã cette application (ici gpscope) indÃ©pendant de tous les noms d’utilisateurs "en chair et en os" qui risqueraient de faire une fausse manoeuvre compromettant le bon dÃ©roulement des tÃ¢ches automatisÃ©es.

L’ensemble du processus s’appuie sur une structure de quatre grands rÃ©pertoires :
– le rÃ©pertoire des donnÃ©es Ã traiter
– le rÃ©pertoire de calcul
– le rÃ©pertoire d’archivage des donnÃ©es
– le rÃ©pertoire de la page web consacrÃ©e au chantier

Acheminement des donnÃ©es

Cette Ã©tape est spÃ©cifique Ã chaque source de donnÃ©es. Le traitement "gÃ©nÃ©rique" des donnÃ©es ne peut commencer qu’aprÃ¨s cette Ã©tape dont les procÃ©dures sont forcÃ©ment dÃ©diÃ©es. La seule contrainte commune Ã toutes ces procÃ©dures est d’amener les donnÃ©es, sous un format compris de gamit (texte RINEX, Hatanaka, compressÃ© ou non), au point d’entrÃ©e de l’Ã©tape suivante qui elle, est gÃ©nÃ©rique.

Ce point d’entrÃ©e est un rÃ©pertoire "de dÃ©pÃ´t" oÃ¹ convergent toutes les donnÃ©es nouvelles pour un mÃªme chantier. dans notre cas, nous avons les rÃ©pertoires gpscope/deposit/cori pour le chantier Corinthe, gpscope/deposit/chil pour le chantier chili, etc.

J’ai successivement dÃ©veloppÃ© plusieurs mÃ©thodes d’acheminement des donnÃ©es. Je les survole rapidement :

Le premier cas est celui oÃ¹ elles arrivent directement du rÃ©cepteur GPS. Nous avons alors un fichier brut au format constructeur. Nous sommes donc Â« centre opÃ©rationnelÂ » et il est de notre responsabilitÃ© de sauvegarder ces fichiers bruts avant de les traduite en rinex et de les introduire dans le calcul.

Le second cas est celui oÃ¹ nous avons directement accÃ¨s Ã des donnÃ©es RINEX.

J’ai d’abord travaillÃ© avec des scripts shell qui utilisaient ftp. Tous ces scripts de rapatriement de donnÃ©es devaient maintenir une liste des donnÃ©es dÃ©jÃ tÃ©lÃ©chargÃ©es. Cette liste Ã©tait comparÃ©e chaque jour Ã la liste des donnÃ©es prÃ©sentes sur le site distant [1], de faÃ§on Ã ne tÃ©lÃ©charger que les nouveaux fichiers. L’Ã©lÃ©ment critique de cette mÃ©thode est la liste des fichiers dÃ©jÃ tÃ©lÃ©chargÃ©s : une manipulation malheureuse et on reprend tout Ã zÃ©ro.

Maintenant je prÃ©fÃ¨re comparer les fichiers distants au contenu de l’archive locale ET Ã celui du rÃ©pertoire des donnÃ©es en attente de calcul. C’est un peu acrobatique en script shell mais immÃ©diat en Perl grÃ¢ce aux modules Net::FTP et POSIX.

Le cas le plus favorable est celui oÃ¹ l’on dispose d’un accÃ¨s ssh Ã la machine distant. J’Ã©cris alors sur la machine distante une routine qui, chaque jour, crÃ©e un fichier texte par annÃ©e d’archive contenant la liste des RINEX de l’annÃ©e avec leur chemin absolu(strictement la sortie d’un ls ${annee}/*/rinex/*d.Z). Je rÃ©cupÃ©re cette liste par scp sur la machine locale (l’utilisation du fichier ~/.netrc simplifie encore l’Ã©criture du script) et je copie les fichiers manquants par scp Ã©galement : plus de ftp!

Ces procÃ©dures sont durcies Ã chaque nouveau problÃ¨me rencontrÃ©. L’interruption de la connexion pendant le tÃ©lÃ©chargement reste cependant un problÃ¨me sans solution dÃ©finitive. MÃªme la comparaison des tailles des fichiers peut ne pas suffire, car elle dÃ©pend des types de systÃ¨mes de fichiers distants et locaux. Un ftp en mode ASCII sur une machine Windows peut Ã©galement rajouter des \r Ã chaque ligne...

Pour surveiller le rapatriement, le script sh_mail_new, activÃ© une fois par jour, explore tous les logs de tous les scripts de rapatriement (ils commencent tous en sh_ftp_data...) Ã la recherche de lignes du type "sitejjj0.aad.Z is a new file" et envoie un Email Ã une liste de diffusion prÃ©dÃ©finie avec la liste de ces fichiers, par script, en indiquant la date de l’information.

J’ai traitÃ© le cas des donnÃ©es brutes qui arrivent "Ã pied" Ã l’institut par la crÃ©ation d’un rÃ©pertoire "de vrac" en Ã©criture pour tous. Chacun peut y dÃ©poser ses donnÃ©es comme il veut et me le signale par Email. Je me charge d’en contrÃ´ler le format et de les injecter dans le circuit automatisÃ©. MÃªme si je ne suis pas infaillible, cela limite dÃ©jÃ beaucoup les risques d’introduction de "grains de sable" dans la mÃ©canique.

Identication des jours Ã calculer

La premiÃ¨re Ã©tape consiste Ã faire l’inventaire des jours de caculs correspondant aux donnÃ©es prÃ©sentes dans le rÃ©pertoire de dÃ©pÃ´t. Le script sh_newdata renvoie une ligne contenant tous les couples (annÃ©e, jour) trouvÃ©s et copie toutes ces donnÃ©es dans le sous-rÃ©pertoire ./rinex du rÃ©pertoire d’expÃ©rience.

Ensuite, comme les donnÃ©es sont calculÃ©es au fur et Ã mesure de leur arrivÃ©e, certaines ont Ã©tÃ© caculÃ©es avec des orbites prÃ©dites ou rapides. sh_process_master explore ./rinex Ã la recherche de donnÃ©es d’il y a deux jours (dÃ©lai d’obtention d’orbites rapides) et d’il y a 23 jours (pire dÃ©lai constatÃ© pour des orbites finales). Si ces donnÃ©es existent, ces jours sont ajoutÃ©s Ã la liste des calculs Ã lancer.

Enfin, diffÃ©rentes pannes d’infrastructure (coupures Ã©lectriques, dÃ©faillance des disques rÃ©seau, du serveur de nom, etc.) peuvent empÃªcher le lancement quotidien de ces calculs. c’est pourquoi sh_process_master maintient dans le rÃ©pertoire d’expÃ©rience un fichier orbit.log du type :

06 136 IGSR
06 137 IGSR
06 138 IGSR
06 139 IGSR
06 140 IGSR
06 141 IGSR
06 142 IGSR
06 143 IGSR
06 144 IGSR
06 145 IGSR
06 146 IGSR
06 147 IGSR
06 148 IGSR
06 149 IGSR
06 150 IGSR
06 151 IGSR
06 152 IGSR
06 153 IGSR
06 154 IGSR
06 155 IGSR
06 156 IGSR
06 157 IGSP

Il s’agit des couples (annÃ©e, jour) qui n’ont pas Ã©tÃ© traitÃ©s avec des orbites finales. A ce stade, tous les jours au-delÃ des 23 jours indiquÃ©s au-dessus sont ajoutÃ©s Ã la liste des calculs Ã lancer.

Si le vecteur $yrdoy qui contient l’ensemble des couples (annÃ©e, jour) Ã calculer ne possÃ¨de aucun Ã©lÃ©ment, le script s’arrÃªte.

Plus un processus tourne longtemps, plus il y a de chances pour qu’un incident extÃ©rieur (panne de courant, disparition des disques distants, redÃ©marrage de la machine, etc.) vienne l’interrompre. Des interruptions trop frÃ©quentes amÃ¨ne le vecteur $yrdoy Ã dÃ©passer la taille maximale admise par le systÃ¨me d’exploitation ("Argument list too long" est le message d’erreur typique). J’en suis arrivÃ© Ã mettre une limite en dur sur le nombre de jours traitÃ©s en une fois. Pour l’instant j’ai fixÃ© ce nombre Ã 24 et chaque chantier est calculÃ© une fois par jour. Je rythme alors le lancement de la procÃ©dure en fonction de la durÃ©e d’un calcul journalier de faÃ§on Ã Ãªtre sÃ »r que deux lancements successifs ne se marchent jamais sur les pieds (une fois par jour pour La RÃ©union, une fois tous les quatre jours pour le Chili, etc.). Pour rattraper des gros retards sans perdre des demi-journÃ©es entiÃ¨res, j’ai mÃªme fini par Ã©crire une procÃ©dure qui teste tous les quarts d’heure si la procÃ©dure principale tourne dÃ©jÃ en mÃ©moire. Dans la nÃ©gative, elle la lance !

calcul effectif

AprÃ¨s avoir affichÃ© Ã l’Ã©cran la liste des couples (annÃ©e, jour) pour lesquels un calcul va Ãªtre lancÃ©, sh_process_master lance sh_gamit pour chacun d’eux (le rÃ©pertoire jour correspondant, s’il existe dÃ©jÃ , est supprimÃ© avant chaque calcul).

La sortie Ã©cran de sh_gamit est redirigÃ©e dans le rÃ©pertoire d’expÃ©rience vers le fichier sh_gamit.log (qui ne correspond donc qu’au calcul en cours ou au dernier calcul effectuÃ©).

Pour donner un minimum de flexibilitÃ© Ã cette procÃ©dure gÃ©nÃ©rique, sh_process_master regarde s’il trouve dans le rÃ©pertoire d’expÃ©rience un fichier gamit.OPT. Dans l’affirmative, il s’agit d’options non standard Ã rajouter sur la ligne de commande sh_gamit. C’est par exemple lÃ que j’ajoute -rinex_ftpsites ign kreiz -ftp_prog wget qui sont des options propres Ã un chantier et Ã la localisation de la machine de calcul derriÃ¨re la passerelle de l’IPGP [2] (attention, il faut aussi un fichier ftp_info spÃ©cifique Ã l’IPGP).

Une fois le calcul effectuÃ©, sh_process_master met Ã jour le fichier orbit.log, affiche Ã l’Ã©cran les Ã©ventuelles lignes de sh_gamit.log contenant les mots ERROR ou FATAL, ainsi que la liste des fichiers rinex utilisÃ©s.

validitÃ© du calcul

La validitÃ© d’un calcul est une vaste question. J’ai choisi, Ã ce stade, de rester modestement sur un critÃ¨re que je qualifierais de purement informatique : l’existence d’un fichier o indexÃ© en a dans le rÃ©peroitre jour.

Si ce fichier existe,
– les donnÃ©es sont supprimÃ©es du rÃ©pertoire de dÃ©pÃ´t (ne les supprimer que maintenant de ce rÃ©pertoire est une sÃ©curitÃ© par rapport Ã une panne qui interromprait la procÃ©dure : ces donnÃ©es restent dans "la salle d’attente" tant que l’on n’est pas sÃ »r de les avoir traitÃ©es au moins une fois).
– les diffÃ©rents fichiers h prÃ©sents (du fait de calculs antÃ©rieurs) dans ./glbf et ./gsoln et les fichiers globk (.prt, .log, .gdl, .org) pour ce jour sont supprimÃ©s. Ainsi, toujours en cas d’interruption de la procÃ©dure, les sÃ©ries temporelles ne risquent pas d’afficher des points issus d’anciens calculs.
– le fichier nav de ./brdc
– Si le calcul est effectuÃ© avec des orbites finales, les fichiers RINEX externes sont supprimÃ©s de ./rinex (identifiÃ©s Ã partir de la mention ftprnx du fichier sites.defaults).

Si ce fichier n’existe pas,
– le fichier sh_gamit.log est renommÃ© en ajoutant le jour julien en extension (ce qui permet de regarder a posteriori ce qui s’est passÃ©).
– les sous-rÃ©pertoires ./igs ./gfiles ./brdc et le rÃ©pertoire jour sont supprimÃ©s ainsi que les fichiers ut1 et pole de ./tables [3].

Nettoyage

A la fin de l’ensemble des calculs gamit journaliers, sh_clean_expe supprime tous les fichiers temporaires accumulÃ©s dans les diffÃ©rents sous-rÃ©pertoires. La reprise en une fois de plusieurs annÃ©es de calcul peut crÃ©er un nombre de fichiers temporaires supÃ©rieur Ã ce que peut supporter le systÃ¨me d’exploitation -"Argument list too long.". Mais cela n’a aucune chance de se produire dans le cas d’un calcul routinier ; il faut une intervention humaine pour provoquer ce dÃ©bordement.

calcul de la sÃ©rie temporelle

A chaque boucle sur le calcul gamit journalier, sh_process_master a mis Ã jour les valeurs du plus ancien couple (annÃ©e, jour) pris en compte. Il est donc en mesure maintenant de lancer sh_glred sur la pÃ©riode s’Ã©tendant du plus ancien jour calculÃ© au plus rÃ©cent prÃ©sent dans le rÃ©pertoire d’expÃ©rience.

Comme pour sh_gamit, un minimum de flexibilitÃ© est introduit par le fichier glred.OPT, prÃ©sent ou non dans le rÃ©pertoire d’expÃ©rience [4]. En son absence, les options G E H sont celles prises par dÃ©faut. Mais les scripts sh_plot_... qui suivent rendent l’option E de sh_glred inutile.

Lorsqu’un calcul gamit est interrompu (lors d’une panne de courant, par exemple), il arrive qu’un fichier h tronquÃ© soit gÃ©nÃ©rÃ©. Il en rÃ©sulte que htoglb tourne sans fin sur ce fichier, ce qui bloque sh_glred et sh_process_master. La premiÃ¨re chose que je fais pour palier Ã ce problÃ¨me est, avant de lancer sh_glred, de vÃ©rifier s’il y a dÃ©jÃ un processus htoglb en train de tourner. Dans l’affirmative je le tue. Cela a pour consÃ©quence la sortie du processus sh_glred liÃ© Ã ce htoglb et la continuation de l’instance prÃ©cÃ©dente de sh_process_master (Ã ce moment lÃ , j’ai deux sh_process_master qui tournent sur la machine). AprÃ¨s l’execution de sh_glred je vÃ©rifie que le dernier htoglb mentionnÃ© dans sh_glred.log traitait bien le dernier jour indiquÃ© dans la commande sh_glred. Sinon, je supprime le rÃ©pertoire jour correspondant (pour Ã©viter que le prochain calcul ne bloque Ã nouveau sur ce fichier h) et je transfÃ¨re les fichiers rinex de ce jour vers le rÃ©pertoire "de dÃ©pÃ´t". Le fichier h sera ainsi rÃ©gÃ©nÃ©rÃ© par le prochain calcul gamit.

crÃ©ation de graphiques "court-terme"

AprÃ¨s destruction de tous les fichiers gif ou post-script Ã©ventuellement prÃ©sents dans ./gsoln, sh_plot_shortterm lance les outils de la suite gamit/globk afin de visualiser les sÃ©ries temporelles des 90 derniers jours de donnÃ©es (sh_plot_shortterm prend en arguments les deux couples (annÃ©e, jour) extrÃªmes de la suite de jours que l’on veut visualiser). Les fichiers finaux sont des gif.

crÃ©ation de graphiques "long-terme"

AprÃ¨s destruction de tous les fichiers gif ou post-script Ã©ventuellement prÃ©sents dans ./gsoln, sh_plot_longterm lance les outils de la suite gamit/globk sur l’ensemble des fichiers org prÃ©sents dans ./gsoln de faÃ§on Ã obtenir l’intÃ©gralitÃ© de la sÃ©rie temporelle acuellement disponible. Les fichiers finaux sont des gif.

Je ne dÃ©velopperai pas ici des aspects propres aux outils gamit/globk, mais la rÃ©alisation d’un graphique de sÃ©rie temporelle sur plusieurs annÃ©es peut dÃ©passer les capacitÃ©s du systÃ¨me selon comment on utilise les utilitaires proposÃ©s par le MIT.

Dans les deux cas (court et long terme), je me suis laissÃ© la possibilitÃ© de passer des options aux outils gamit (sh_plotcrd) par le fichier plot.OPT dans ./gsoln [5]. Les chantiers sur les volcans prÃ©sentent des barres d’erreur supÃ©rieures aux autres : je prends cela en compte en choisissant des valeurs diffÃ©rentes pour les paramÃ¨tres maxsigne et maxsigu, ce qui change le niveau de bruit des points admis sur la visualisation des sÃ©ries temporelles.

AprÃ¨s suppression de l’ensemble des images contenues dans le rÃ©pertoire du site web qui leur est dÃ©diÃ©, sh_process_master y copie les nouvelles images de sÃ©ries temporelles, puis lance sh_web_data qui explore le sous-rÃ©pertoire ./rinex et copie dans l’archive de l’Ã©quipe les donnÃ©es qui n’y sont pas encore tout en crÃ©ant diffÃ©rents liens symboliques sur le site Web qui permettront de trouver ces donnÃ©es par site ou par date sans multiplier les fichiers.

Pour certains chantiers il m’Ã©tÃ© demandÃ© de fournir des graphiques supplÃ©mentaires (par exemple les lignes de bases par rapport Ã un site). Pour permettre cette flexibilitÃ© j’ai ajoutÃ© la possibilitÃ© d’exÃ©cuter un script sh_specific_nom_expÃ©rience1 juste aprÃ¨s sh_plot_shortterm, et un script sh_specific_nom_expÃ©rience2 juste aprÃ¨s sh_plot_longterm. Si ce script est prÃ©sent dans le rÃ©pertoire d’expÃ©rience, il est exÃ©cutÃ© par sh_process_master [6].

utilitaires

Certaines tÃ¢ches devaient Ãªtre exÃ©cutÃ©es indÃ©pendamment de ce calcul principal :
– sh_updt_tables : met Ã jour les tables gamit Ã partir du site de sopac et de celui de gamit. Il travaille sur l’ensemble des versions gamit prÃ©sentes [7] et termine en rÃ©-Ã©crivant tous les fichiers station.info de tous les chantiers (par fusion des ./tables.templates/station.info.EXPE avec le dernier station.info.sopac.newfmt, ce qui me permet de suivre l’Ã©volution des stations IGS sans effort).
– sh_clean_old : supprime tous les rÃ©pertoires jour et les donnÃ©es rinex (aprÃ¨s vÃ©rification de leur existence dans l’archive de l’Ã©quipe) du rÃ©pertoire d’expÃ©rience s’ils sont plus vieux qu’un certain nombre de jours actuellement fixÃ© Ã 60. Cela Ã©vite de saturer le disque.
– sh_arch_gamres : range les fichiers o, h et q prÃ©sents dans le rÃ©pertoire d’expÃ©rience dans l’archive des donnÃ©es.

Gestion automatique

La clef de tout Ã§a est la crontab de la machine qui fait les calculs. Voici l’exemple de la machine qui fait non seulement le calcul de trois rÃ©seaux diffÃ©rents mais Ã©galement le rapatriement de l’ensemble des donnÃ©es pour toutes les machines. On notera la sauvegarde, une fois par semaine, de certains rÃ©sultats des calculs (faits localement pour gagner en temps d’accÃ¨s et ne pas saturer le rÃ©seau local) vers le disque rÃ©seau qui lui, est sauvegardÃ© par le service informatique.

SHELL=/bin/tcsh
LD_LIBRARY_PATH=/data/geodesie_S/gpscope/gnu/lib:/usr/lib:/usr/local/lf9560/lib:/usr/X11R6/lib:/usr/local/lib:/usr/lib/Real:/usr/local/dislin-7.5
EXPE4=/data4/gpscope
EXPE3=/data3/gpscope
EXPE2=/data2/gpscope
EXPE=/data/geodesie_S/gpscope/experiment
DEPO=/data/geodesie_S/gpscope/deposit
WEB=/data/geodesie_S/WWW/gpscope
ARCH=/data/geodesie_S/gpsdata
00      00      *       *       2       ~/gamitutl/bin/sh_updt_tbl ${EXPE} >&! ~/sh_updt_tbl.log
00      12      *       *       *       ~/gamitutl/bin/sh_mail_new >&! sh_mail_new.log
00      00      *       *       2       rdist -f ~/distfile.geodesie1 >&! ~/rdist.geodesie1.log
00      00      *       *       3        ~/gamitutl/bin/sh_clean_old ${EXPE4}/cori 60 ${ARCH}/corinthe >&! sh_clean_old_cori.log
00      00      *       *       3        ~/gamitutl/bin/sh_clean_old ${EXPE3}/boum 60 ${ARCH}/algerie >&! sh_clean_old_boum.log
00      00      *       *       3        ~/gamitutl/bin/sh_clean_old ${EXPE2}/gant 60 ${ARCH}/antilles >&! sh_clean_old_boum.log
45      02      *       *       *       ~/gamitutl/bin/sh_ftp_data_reunion ${DEPO}/ign.lst ${DEPO}/hudson.lst >&! ~/sh_ftp_data_reunion.log
00      06      *       *       *       ~/gamitutl/bin/sh_ftp_data_dionysos ${DEPO}/dion.lst >&! ~/sh_ftp_data_dionysos.log
15      07      *       *       *       ~/gamitutl/bin/sh_ftp_data_corinth ${DEPO}/helios.lst >&! ~/sh_ftp_data_corinth.log
15      07      *       *       *        ~/gamitutl/bin/sh_ftp_data_patras ${DEPO}/patras.lst >&! ~/sh_ftp_data_patras.log
28      10      *       *       *       ~/gamitutl/bin/sh_ftp_data_boum ${DEPO}/hakim.lst >&! ~/sh_ftp_data_boum.log
00      09      *       *       *       ~/gamitutl/bin/sh_ftp_data_chili chili.lst >&! ~/sh_ftp_data_chili.log
00     05      *       *       *       ~/gamitutl/bin/sh_process_master ${EXPE3}/boum ${DEPO}/boum ${WEB}/algeria ${ARCH}/algerie >>&! ~/sh_process_master_boum.log; ~/gamitutl/bin/sh_arch_gamres ${EXPE3}/boum ${ARCH}/algerie >&! ~/sh_arch_gamres_boum.log
00     19      *       *       *       ~/gamitutl/bin/sh_process_master ${EXPE4}/cori ${DEPO}/cori ${WEB}/corinth ${ARCH}/corinthe >>&! ~/sh_process_master_corinth.log; ~/gamitutl/bin/sh_arch_gamres ${EXPE4}/cori ${ARCH}/corinthe >&! ~/sh_arch_gamres_cori.log
00     01      *       *       *       ~/gamitutl/bin/sh_process_master ${EXPE2}/gant ${DEPO}/gant ${WEB}/antilles ${ARCH}/antilles >>&! ~/sh_process_master_gant.log; ~/gamitutl/bin/sh_arch_gamres ${EXPE2}/gant ${ARCH}/antilles >&! ~/sh_arch_gamres_gant.log

Pour chaque script la sortie est redirigÃ©e vers un fichier log spÃ©cifique qui permettra de retracer les Ã©vÃ¨nements en cas de problÃ¨me. Afin de ne pas gÃ©nÃ©rer trop de logs illisibles, seules les sorties de sh_process_master n’Ã©crasent pas la sortie prÃ©cÃ©dente. Je supprime ce fichier de temps en temps, par exemple quand je vÃ©rifie que rien d’anormal ne s’est passÃ© au cours des derniÃ¨res semaines.

J’ai rÃ©digÃ© la premiÃ¨re version de cet article lorsque je travaillais Ã l’IPGP qui est ce que l’IGS appelle un Â« centre opÃ©rationnelÂ », c’est Ã dire un endroit oÃ¹ l’on s’occupe de la rÃ©cupÃ©ration des donnÃ©es depuis le terrain (que ce soit avec une Ã©tape dans les observatoires ou directement depuis la Â« maison mÃ¨reÂ »). La mise Ã disposition des donnÃ©es sur le Web n’intervenait qu’aprÃ¨s le calcul et constituait l’ultime Ã©tape du cheminement des donnÃ©es.

Aujourd’hui, en tant que support de la communautÃ© GPS nationale, je dois distinguer deux types de services que je peux rendre aux centres opÃ©rationnels :
– La mise Ã disposition sur le Web et l’archivage centralisÃ© des donnÃ©es INSU au sens large.
– Le calcul automatique de certains chantiers sur demande des scientifiques concernÃ©s.

Pour sÃ©parer ces deux services, j’ai crÃ©Ã© un rÃ©pertoire de transit, avec encore des sous-rÃ©pertoires par chantiers. Chaque jour je compare ce que les centres opÃ©rationnels proposent sur leur archive avec ce dont je dispose dÃ©jÃ et je tÃ©lÃ©charge la diffÃ©rence dans mon rÃ©pertoire de transit.
Sur les fichiers prÃ©sents dans ce rÃ©pertoire j’effectue successivement :
– une copie dans mon archive
– une crÃ©ation des liens Ã partir du site Web vers l’archive pour la mise Ã disposition
– Ã©ventuellement une copie de ces mÃªmes fichiers dans le rÃ©pertoire de dÃ©pÃ´t, en attente de calcul.
– l’effacement de tout ce que contient le rÃ©pertoire de transit.

Ce nouveau rÃ©pertoire est donc vide la plupart du temps. L’archivage et la mise Ã disposition sur le Web ne font plus partie de la procÃ©dure standard de calcul !

[1] selon les sites, la liste du disponible peut rapidement dÃ©passer les capacitÃ©s du systÃ¨me d’exploitation ("Argument list too long." est le message d’erreur classique dans ce cas lÃ ). Les solutions adoptÃ©es varient en fonction des sites. Parmi elles, il y a l’exploration limitÃ©e Ã l’annÃ©e de la derniÃ¨re donnÃ©e rÃ©cupÃ©rÃ©e (et Ã©ventuellement l’annÃ©e immÃ©diatement prÃ©cÃ©dente) ; si on a la chance de pouvoir utiliser lftp, un DIR /*/*/SITE* tmp.dir peut Ã©galement sauver la situation.

[2] pour ne pas avoir des fichiers Ã sauvegarder dans tous les coins, mon fichier gamit.OPT se trouve en fait dans mon sous-rÃ©pertoire ./tables.templates et c’est un lien symbolique vers ce fichier qui se trouve dans le rÃ©pertoire d’expÃ©rience.

[3] Cette liste n’est Ã©tablie qu’Ã partir des problÃ¨mes dÃ©jÃ rencontrÃ©s. Il est par exemple arrivÃ© qu’un fichier sp3 final soit faux pendant plusieurs jours avant d’Ãªtre modifiÃ©. Si le mauvais fichier est dÃ©jÃ prÃ©sent localement, sh_gamit ne cherchera pas Ã le tÃ©lÃ©charger...

[4] et comme pour gamit.OPT, mon fichier glred.OPT se trouve dans mon sous-rÃ©pertoire ./gsoln.templates. c’est un lien symbolique vers ce fichier qui se trouve dans le rÃ©pertoire d’expÃ©rience.

[5] Un lien symbolique vers ./gsoln.templates/plot.OPT bien sÃ »r !

[6] Evidemment il s’agit encore une fois d’un lien symbolique, cette fois vers mon rÃ©pertoire de scripts "maison" ~gpscope/gamitutl/bin.

[7] Bien que j’essaie de coller au plus prÃ¨s des derniÃ¨res versions gamit, je maintiens souvent l’avant-derniÃ¨re version pour ne pas perturber les Ã©tudiants qui ont commencÃ© avec celle-lÃ

Dans la même rubrique :