Una línea de código fue capaz de congelar el tráfico de aéreo de UK durante una hora

Una línea de código fue capaz de congelar el tráfico de aéreo de UK durante una hora
12 comentarios Facebook Twitter Flipboard E-mail

Doce de diciembre de 2014. Un día más en el espacio aéreo de Reino Unido. Mal tiempo y la llegada de la Navidad que por el volumen de tráfico siempre produce retrasos y cancelaciones de todo tipo. Sin embargo, ese día fue algo diferente. Todo se paralizó durante una hora aproximadamente.

Esta semana la autoridad de aviación civil en Reino Unido lanzó un informe en el que explicó el colapso que sufrió a mediados del pasado mes de diciembre. El problema fue causado por un error en el software, más concretamente en una línea de código que tuvo paralizado al país durante una hora.

Una línea capaz de bloquear el sistema de ruta

NATS, la agencia que opera el tráfico aéreo en Reino Unido, se encontró con un problema que, según ellos, jamás habían visto. Durante esas fechas tuvieron que habilitar terminales adicionales y tuvieron un error con el software que se encarga de gestionar los vuelos.

De entre los cincuenta sistemas que trabajan en el centro de operaciones y las más de cuatro millones de códigos de líneas que se ejecutan, fue una y solo una la que provocó que durante 45 minutos se paralizara el tráfico aéreo. Los planes de vuelo se cargan en un servidor donde se minimizan los recursos compartidos para evitar que se produzca una sobrecarga.

Uno de los controladores pulsó un botón que ponía las workstation en modo observación. Es decir, desde ésta la persona que la opera puede ver lo que hay en las otras workstation. Cuando esto ocurre, el sistema primario del servidor donde se carga la ruta de vuelo ejecuta más instrucciones atómicas de las que en realidad puede cargar. Es aquí donde se encuentra el fallo que provocó que se paralizara el tráfico aéreo.

Si este ocurre, el servidor de vuelo se apaga para reducir el riesgo de enviar datos erróneos a la workstation del controlador. Es entonces cuando se activa el sistema de respaldo. En este caso se repite el mismo error al estar la workstation en modo observación. Según el informe fue la primera vez que ocurrió y en 45 minutos fue resuelto. Por fortuna, aquel día no hubo ningún accidente.

Foto | Flickr

Vía | ZDNet

Comentarios cerrados
Inicio