Taille: 10306
Commentaire:
|
Taille: 8635
Commentaire:
|
Texte supprimé. | Texte ajouté. |
Ligne 15: | Ligne 15: |
= Incidents actuels = ##DEBUT incidents actuels ||<tablewidth="99%" tablestyle="text-align:center"20%>'''Date''' ||'''Description de l'incident''' || |
|
Ligne 16: | Ligne 19: |
= Incidents actuels = ||<tablewidth="99%" tablestyle="text-align:center"20%>'''Date''' ||'''Description de l'incident''' || || Dimanche 14 décembre à partir de 21h40 || Coupure de courant au bâtiment A. Pas d'accès internet par conséquent || |
|
Ligne 20: | Ligne 20: |
##FIN incidents actuels |
|
Ligne 21: | Ligne 23: |
||<tablewidth="99%" tablestyle="text-align:center"20%>'''Date''' ||'''Description de l'incident''' || | ||<tablewidth="99%" tablestyle="text-align:center"20%>'''Date''' ||'''Description de l'incident''' || |
Ligne 26: | Ligne 29: |
|| Mardi 9 décembre à partir de 13h jusqu'au lendemain 9h || L'imprimante est encore en rade, intervention prévue demain matin || || Jeudi 9 octobre de 00:50 à 1h30 || Problème de partage des dossiers adhérents suite au redimensionnement d'une partition annexe, un reboot d'une partie des serveurs (dont zamok) a été réalisé || || du jeudi 25 septembre 2014 13h40 au mardi 30 à 17h50 || La connectivité IPv6 est perdue suite à une panne du tunnel ( [[https://www.sixxs.net/tickets/?pop=frmrs01|Ticket incident chez sixxs]], [[https://www.sixxs.net/misc/traffic/?pop=frmrs01&last=1year|Traffic frmrs01]], [[http://munin.crans.org/crans.org/odlyd.crans.org/if_sixxs.html|traffic ipv6 crans]] ) || ||Du vendredi 26 septembre, 18h au 1er octobre (environ) || Instabilité de la connectivité entre l'ENS et rubis. La responsable technique de l'ENS a été contactée.|| || Dimanche 28 septembre de 22h15 à 22h45 || Coupure de courant au bâtiment H. || || Du 7 juin au 15 septembre 2014 || L'ancienne imprimante est en fin de vie. Une nouvelle imprimante est mise en place. || || Du samedi 20, 18h, au lundi 22 septembre 2014, 21h30 || L'interface réseau d'administration de {{{ft}}} était en débit limité, ce qui a occasionné des difficultés de fonctionnement au wiki, à l'intranet2, et au serveur de mails || || De mi-septembre au 22/09/2014 à 12h30 || Une erreur de configuration du parefeu de l'ENS a rendu l'ensemble de la zone ENS non pinguable de l'extérieur. || || Samedi 23 août à partir de 7h à 18h || La migration de l'espace de stockage des adhérents, ainsi que le remplacement du routeur de sortie ont nécessité une coupure de l'ensemble des services. Un transfert de données supplémentaires a requis une coupure plus longue des services annexes.|| || 9 juin 2014 de 12h00 à 14h15 || Un commutateur du bâtiment G (batg-9) en panne : pas de réseau au 1er et 2nd étage du bâtiment G. Une connexion temporaire a été mise en place le temps de la mise en place d'un nouveau commutateur (24 juin vers 23h) || || 13 juin 2014 à 12h15 et 24 juin 2014 de 7h50 à 10h35 || Commutateurs du bâtiment M disjonctés || || 15 mai 2014 de 16h20 à 20h30 || Suite à une commande foireuse, les droits d'un grand nombre de fichiers sur zamok ont été altérés, rendant celui-ci totalement inutilisable pendant 20 min, puis partiellement corrompu de 16h40 à 20h30. La restauration d'une sauvegarde a été nécessaire. Les homes des adhérents n'ont pas été touchés. || ||À partir du 8 avril ||Suite à une faille de sécurité de la librairie openSSL, tous les certificats utilisés par le crans sont remplacés. Plus d'informations sur la faille, ainsi que l'empreinte des nouveau certificats, sur HeartBleed. || ||Mardi 2 avril vers 21h00 jusqu'à 21h40 || Ethernet inutilisable au bâtiment M, disjoncteur à remettre en place|| ||Mercredi 2 avril vers 13h50 jusqu'à 14h09 ||Problèmes de routages de la zone zrt par pioneer, passage en connexion de secours || ||A partir du 1er Mars à 11h55 ||L'imprimante a des problèmes de bourrage récurrents. Un technicien devrait passer dans les prochains jours pour régler le problème || ||Lundi 24 mars de 18h à 18h20 ||Incident matériel au niveau du cœur du réseau (backbone), tous les services étaient impactés. || ||Jeudi 6 mars vers 1h30 ||''Réseau inaccessible''<<FootNote(Enfin c'est le premier truc qui m'est venu à l'esprit, c'est peut-être une dramatique erreur syntaxique)>> : Wiki, site, news, IRC. Près de 17 utilisateurs sont déconnectés de #flood, et on nous rapporte des échecs répétitifs de connexion, jusqu'à plus d'une dizaine de fois pour les utilisateurs rafraîchissant rapidement leur page. L'incident semble être réglé vers 1h36, heure du Cr@ns <<FootNote(Il faut noter qu'au même moment, il n'était en Angleterre que minuit trente, l'heure où normalement le wiki chante, d'où la peine immense des WikiNinjas privés de leur raison d'être)>>. <<BR>> ''Plus de détails'' : Le service de gestion des disques de la baie de disques a redémarré sur ft au moment où on ajoutait fy au cluster. Toutes les machines virtuelles plantent car elles n'ont plus accès à leurs disques, et on peut rien migrer car l'ajout au cluster plante, bloquant une partie des commandes. Le problème est rapidement résolu par les nounous. <<BR>> ''Merci'' de ces précisions, Glados-user ! -- WikiCandy [qui se demande bien qui tu es] [et qui apprécie particulièrement ta tournure de phrase] (et qui surkiffe spammer les nounous) || ||Mecredi 19 février 2014 de 1h à 3h environ ||Une erreur de manipulation sur un virtualiseur a nécessité le redémarrage des machines virtuelles hébergés sur celui-ci. Ceci a pu impacter certains services pendant quelques minutes (notamment irc). Le serveur des adhérents (zamok) a également été redémarré. || ||Vendredi 14 février entre 11h30 et 11h45 ||Une coupure électrique a impacté plusieurs bâtiments de l'ENS Cachan dont les salles serveurs de la dsi, entraînant une coupure de la connexion internet d'une dizaine de minute. || ||Du vendredi 7 février au soir au mardi 11 à 17h ||On constate des pertes de connexions d'une dizaine de secondes plusieurs fois par heure. Lundi soir à partir de 21h, ces pertes de connexion furent beaucoup plus nombreuses. Cf ticket incident [[http://pasillo.renater.fr/TICKETS/requete_ticket.php?NUMBER=2712352&DATER=1392309961|Renater]]. || ||Mercredi 22 janvier 2014 de 23h20 à 23h26 environ ||Erreur de configuration des réseaux virtuels sur le backbone, l'ENS n'était plus joignable, ainsi que le reste du monde. || ||Mercredi 22 de 10h39 à 11h44 et jeudi 30 janvier 2014 de 10h48 à 11h40 environ, matinée du mardi 11 février ||Pannes électriques récurrentes dans le local de brassage du bâtiment M. Le réseau filaire et WiFi étaient indisponibles. (à investiguer) || ||Matinées du 14 et 20 janvier 2014 ||Problème de routage côté ENS : les connexions http en ipv4 étaient redirigées à tort vers le proxy web de l'ENS. Certains sites web étaient ainsi inaccessibles. || |
|| Depuis environ un mois || Vol d'une borne sur le toit du bâtiment C, desservant le bâtiment H. Ne sera pas remplacée || || Le 25/02/2017 || L'onduleur a décidé de ne plus donner de courant vers 13h. Il a fallu tout redémarrer. Tout est revenu en ordre vers 16h. || || Le 15/02/2017 || Changement du préfixe IPv6 utilisé en production (2a01:240:fe3d::/48 -> 2a06:e042:100::/40). Si vous utilisez une configuration statique pour l'IPv6, pensez à la mettre à jour|| || 10/02/2017 15h00 - 21h00 || Coupure électrique au Crous. L'ensemble des services est impacté. Retour progressif à la normale || || 31/01/2017 16h50 || Mise à jour et reload de bato-1 (switch crans-ens) || || 25/01/2017 21h-03h || Maintenance sur la baie de disques. Tous les services interrompus ~-(intranet (donc le service d'impression), mails, mailing-lists, !OwnCloud, pages perso, gitlab, IRC, discourse, news, wiki, etharpad/calc, limesurvey, !ZeroBin)-~ Une solution de remplacement permet de maintenir la connexion Internet pendant la durée de l'opération. || || 24/01/2017 04h->05h || Erreur dans la BDD sql d'upload qui a causé une saturation du disque et un reboot du routeur || || 19/12/2016 || Réseau saturé sur l'ensemble du campus || || Pas de wifi au G de 15h à 19h30 || Pas de wifi au G || || Le 05/11/2016 20h -> 22h || Mise à jour du serveur Owncloud || || Le 04/10/16 || L'intranet est cassé (/ en read only) || || Le 20/09/16 || Serveur des ml en panne || || Le 16/09/16 || Maintenance serveur news || || Le 3/09/16 || Coupure de courant au batiment M, réglé vers 12h30 || || 30/08/16 || Coupure de courant au J de 10h à 12h, ne pas s'inquiéter || || 29/08/16 || Problèmes avec le nfs, coupure du réseau pendant 1h vers 13h || || Du 2 au 24 août || La mise à jour de [[https://lists.crans.org/|MailMan]] a eu pour effet secondaire que certaines ML ne reçoivent plus les mails. Le problème a été identifié mais la correction est plus ardue qu'il n'y paraît. On a un espoir que les mails ne soient que bloqués et pas perdus. Update : c'est réglé, les mails ont été sauvés. Des choses étranges restent encore à éclaircir… || || 2 août toute la journée || Coupure de l'ensemble des services (toute la journée) et perturbations importantes de l'accès internet, pour maintenance annuelle du local serveurs. || || week-end du 23 juillet|| Problème intermittent de DNS à cause de problèmes survenus lors de la migration du serveur maître.|| || 20 juillet 16h15-17h15 || Coupure totale de l'accès internet suite à une boucle survenue en zone dsi || || 12 avril || Coupure du routeur en vue du remplacement de sa carte mère || || 2 mai de 9h à 12h30 || Maintenance de la climatisation, rangement de l'armoire serveur. Suite à une erreur de manipulation, le serveur des adhérents a été redémarré. || || 5 mai || Coupure du routeur en vue du remplacement de son processeur et sa mémoire vive || || Du 17 février au 15 mars ||Un des disques du serveur FTP est en panne, coupure du serveur à prévoir, et risques de dysfonctionnement en cas de panne d'un second disque -- maj : la synchro est en cours sur charybde || ||Le 9 mars à partir de 00:40 - 1 0mars || Problème électrique au bâtiment G, aucun accès n'est possible depuis ce bâtiment. || ||Le 9 mars 2016 de 2:00 à 10:10 || Problème de connectivité ipv6 sur notre tunnel https://www.sixxs.net/pops/jaguar/ || || Les 4 et 5 Mars 2016 || Suite à des erreurs de manipulation intervenues sur un virtualiseur et la baie de disque, l'accès internet et l'ensemble des services ont été perturbé. Nous vous prions de nous en excuser || ||17-18 février dans la nuit ||Mis à jour du serveur roundcube sous debian jessie, interruption du service || ||20-23 février 2016 ||Un service (imap proxy) dont dépendait !SoGo n'avait pas démarré suite a la maintenance du week-end du 20 février. Le proxy imap a été désactivé dans la configuration de !SoGo. Le service !SoGo devrait à nouveau fonctionner sans problèmes. || ||15-16 février dans la nuit ||Mis à jour du serveur kenobi (pad et bin) sous debian jessie || ||14-15 à 1h ||Interruption des services gitlab et owncloud pendant une durée n'excédant pas 2 minutes || ||Le 9 février 2016 de 14h à 19h ||Coupure d'électricité au H, pas d'internet filaire et wifi || |
Ligne 53: | Ligne 63: |
=== 2015 === * [[CransIncidents/2015|Année 2015]] === 2014 === * [[CransIncidents/2014|Année 2014]] |
Cette page décrit les incidents en cours. C'est un complément à Autostatus permettant de savoir si quelque chose ne fonctionne pas et si les nounous sont déjà au courant.
On peut aussi consulter CransTechnique/PrisesDéfectueuses.
Sommaire
Si vous constatez un dysfonctionnement affectant l'ensemble du réseau, merci de l'indiquer. |
Incidents actuels
Date |
Description de l'incident |
Futures coupures
Date |
Description de l'incident |
Anciens incidents
Date |
Description de l'incident |
Depuis environ un mois |
Vol d'une borne sur le toit du bâtiment C, desservant le bâtiment H. Ne sera pas remplacée |
Le 25/02/2017 |
L'onduleur a décidé de ne plus donner de courant vers 13h. Il a fallu tout redémarrer. Tout est revenu en ordre vers 16h. |
Le 15/02/2017 |
Changement du préfixe IPv6 utilisé en production (2a01:240:fe3d::/48 -> 2a06:e042:100::/40). Si vous utilisez une configuration statique pour l'IPv6, pensez à la mettre à jour |
10/02/2017 15h00 - 21h00 |
Coupure électrique au Crous. L'ensemble des services est impacté. Retour progressif à la normale |
31/01/2017 16h50 |
Mise à jour et reload de bato-1 (switch crans-ens) |
25/01/2017 21h-03h |
Maintenance sur la baie de disques. Tous les services interrompus (intranet (donc le service d'impression), mails, mailing-lists, OwnCloud, pages perso, gitlab, IRC, discourse, news, wiki, etharpad/calc, limesurvey, ZeroBin) Une solution de remplacement permet de maintenir la connexion Internet pendant la durée de l'opération. |
24/01/2017 04h->05h |
Erreur dans la BDD sql d'upload qui a causé une saturation du disque et un reboot du routeur |
19/12/2016 |
Réseau saturé sur l'ensemble du campus |
Pas de wifi au G de 15h à 19h30 |
Pas de wifi au G |
Le 05/11/2016 20h -> 22h |
Mise à jour du serveur Owncloud |
Le 04/10/16 |
L'intranet est cassé (/ en read only) |
Le 20/09/16 |
Serveur des ml en panne |
Le 16/09/16 |
Maintenance serveur news |
Le 3/09/16 |
Coupure de courant au batiment M, réglé vers 12h30 |
30/08/16 |
Coupure de courant au J de 10h à 12h, ne pas s'inquiéter |
29/08/16 |
Problèmes avec le nfs, coupure du réseau pendant 1h vers 13h |
Du 2 au 24 août |
La mise à jour de MailMan a eu pour effet secondaire que certaines ML ne reçoivent plus les mails. Le problème a été identifié mais la correction est plus ardue qu'il n'y paraît. On a un espoir que les mails ne soient que bloqués et pas perdus. Update : c'est réglé, les mails ont été sauvés. Des choses étranges restent encore à éclaircir… |
2 août toute la journée |
Coupure de l'ensemble des services (toute la journée) et perturbations importantes de l'accès internet, pour maintenance annuelle du local serveurs. |
week-end du 23 juillet |
Problème intermittent de DNS à cause de problèmes survenus lors de la migration du serveur maître. |
20 juillet 16h15-17h15 |
Coupure totale de l'accès internet suite à une boucle survenue en zone dsi |
12 avril |
Coupure du routeur en vue du remplacement de sa carte mère |
2 mai de 9h à 12h30 |
Maintenance de la climatisation, rangement de l'armoire serveur. Suite à une erreur de manipulation, le serveur des adhérents a été redémarré. |
5 mai |
Coupure du routeur en vue du remplacement de son processeur et sa mémoire vive |
Du 17 février au 15 mars |
Un des disques du serveur FTP est en panne, coupure du serveur à prévoir, et risques de dysfonctionnement en cas de panne d'un second disque -- maj : la synchro est en cours sur charybde |
Le 9 mars à partir de 00:40 - 1 0mars |
Problème électrique au bâtiment G, aucun accès n'est possible depuis ce bâtiment. |
Le 9 mars 2016 de 2:00 à 10:10 |
Problème de connectivité ipv6 sur notre tunnel https://www.sixxs.net/pops/jaguar/ |
Les 4 et 5 Mars 2016 |
Suite à des erreurs de manipulation intervenues sur un virtualiseur et la baie de disque, l'accès internet et l'ensemble des services ont été perturbé. Nous vous prions de nous en excuser |
17-18 février dans la nuit |
Mis à jour du serveur roundcube sous debian jessie, interruption du service |
20-23 février 2016 |
Un service (imap proxy) dont dépendait SoGo n'avait pas démarré suite a la maintenance du week-end du 20 février. Le proxy imap a été désactivé dans la configuration de SoGo. Le service SoGo devrait à nouveau fonctionner sans problèmes. |
15-16 février dans la nuit |
Mis à jour du serveur kenobi (pad et bin) sous debian jessie |
14-15 à 1h |
Interruption des services gitlab et owncloud pendant une durée n'excédant pas 2 minutes |
Le 9 février 2016 de 14h à 19h |
Coupure d'électricité au H, pas d'internet filaire et wifi |
Historique
2015
2014
2013
2012-2011
2010
2009
2008
2007
2006