В последние дни Optus и Singtel стремились указать на различие между событием, вызвавшим сбой, и его «основной причиной».
В своем заявлении Optus пытается прояснить ситуацию, отмечая, что обновление программного обеспечения на Singtel Internet Exchange – и последующее перенаправление трафика во время его выполнения – стало событием, спровоцировавшим сбой. В нем говорится, что неспособность сети Optus обрабатывать значительный объем новой информации о маршрутизации стала основной причиной перегрузки и сбоя ее сети.
Optus сообщила, что ее центр сетевых операций заметил потерю соединения, затронувшую ее потребительскую сеть, около 4:05 утра 8 ноября, в день инцидента.
На начальных этапах сбоя в Optus заявили, что приоритетом для них является скорейшее восстановление услуг, что требует восстановления подключения к ключевым элементам сети.
«Теперь понятно, что отключение произошло из-за примерно 90 PE-маршрутизаторов. [provider edge routers, which operate between one network service provider’s area and areas administered by other network providers] автоматически самоизолируются, чтобы защитить себя от перегрузки информацией IP-маршрутизации», — говорится в сообщении Optus.
«Эти пределы самозащиты являются настройками по умолчанию, предоставленными соответствующим глобальным поставщиком оборудования (Cisco)».
В Optus заявили, что эта «неожиданная перегрузка» маршрутной информацией произошла после обновления программного обеспечения в сети Singtel Internet Exchange, в частности на одной из станций Singtel в Северной Америке.
«Во время обновления сеть Optus получила изменения в информации о маршрутизации от альтернативного пирингового маршрутизатора Singtel», — говорится в сообщении.
«Эти изменения маршрутизации распространились по нескольким уровням нашей сети IP Core. В результате около 4:05 утра (AEDT) были превышены заранее установленные ограничения безопасности на значительном количестве сетевых маршрутизаторов Optus. Хотя обновление программного обеспечения привело к изменению информации о маршрутизации, это не стало причиной инцидента».
В Optus заявили, что восстановление требует «масштабных усилий на более чем 100 устройствах в 14 объектах по всей стране, чтобы облегчить восстановление (сайт за сайтом).
«Это восстановление было выполнено удаленно, а также требовало физического доступа к нескольким объектам».
По данным Optus, в основную группу персонала, работавшего над разрешением, входило около 150 инженеров, техников и полевых техников.
«Эта основная группа была дополнена 250 дополнительными сотрудниками, обеспечивающими дальнейшую поддержку и мониторинг. Мы также работали с пятью ведущими международными поставщиками, которые помогли нам решить проблему и дать совет».
2023-11-17 02:39:24
1700191858
#Келли #Байер #Розмарин #возглавляет #комитет #Singtel #утвердила #заявление #об #отключении #электроэнергии