Unclassified | Non classifié


Hello fs7 users,

 

The vendor for fs7 has requested a second statistics capturing session in order to diagnose the cause of fs7 performance issues that have been detected intermittent since late November. The first session occurred on January 10.

 

For a period of 15 minutes at some point from 9:00-10:15 ET (14:00-13:15 GMT) on January 31 (tomorrow), we will provoke a high load on fs7 and capture performance statistics. There will likely be a significant slowdown in fs7 read/write speeds during these 15 minutes (but not fs5 speeds). Regardless, feel free to submit and run jobs that use fs7 as usual. But please note that there is a chance that some running jobs timeout (i.e. fail because they ran out of wallclock time) during this period.

 

As soon as we have 15 minutes of statistics, we will stop the high load on fs7 and send out communications that fs7 is stable again. Although there will be an impact, it is crucial for finding a solution to fs7’s performance issues, which have recently been occurring more frequently.

 

 

 

Bonjour aux utilisateurs de fs7,

 

Le fournisseur de fs7 a demandé une deuxième session de capture de statistiques afin de diagnostiquer la cause des problèmes de performance de fs7 qui ont été détectés de manière intermittente depuis la fin du mois de novembre. La première session a eu lieu le 10 janvier.

 

Pendant une période de 15 minutes à un moment donné entre 9:00-10:15 ET (14:00-13:15 GMT) le 31 janvier (demain), nous allons provoquer une charge élevée sur fs7 et capturer des statistiques de performance. Il y aura probablement un ralentissement significatif des vitesses de lecture/écriture de fs7 pendant ces 15 minutes (mais pas des vitesses de fs5). Quoi qu'il en soit, n'hésitez pas à soumettre et à exécuter des travaux utilisant fs7 comme d'habitude. Mais veuillez noter qu'il est possible que certains travaux en cours d'exécution soient interrompus (c'est-à-dire qu'ils échouent parce qu'ils n'ont plus de temps d'horloge) au cours de cette période.

 

Dès que nous disposerons de 15 minutes de statistiques, nous mettrons fin à la forte charge sur fs7 et enverrons des communications indiquant que fs7 est à nouveau stable. Bien que cela ait un impact, il est crucial de trouver une solution aux problèmes de performance de fs7, qui sont apparus plus fréquemment ces derniers temps.

 

Dale

 

 

Team Lead, High Performance Computing Optimization

Integrated HPC Management, Shared Services Canada

dale.mowbray@ssc-spc.gc.ca

 

Chef d'équipe, Optimisation ordinateur haute performance

Calcul de haute de performance intégré, Services partagés Canada

dale.mowbray@ssc-spc.gc.ca