Крупнейшие сбои программного обеспечения за последние годы


Некоторые неудачи хуже, чем другие.

Каждый, кто использует современные технологии, сталкивался с ошибками и сбоями программного обеспечения. Хотя в большинстве случаев ошибки программистов не слишком серьезны, некоторые ИТ-сбои могут иметь действительно ужасные последствия. Другим аспектом является цена, которую платят нарушенные организации.

Согласно отчету RiskIQ, одни только нарушения безопасности обходятся крупным компаниям в 25 долларов в минуту, а крипто-компании могут потерять почти 2000 долларов в минуту из-за киберпреступности. Мы собрали некоторые из наиболее запоминающихся примеров сбоев программного обеспечения за последние годы (с участием многих известных брендов), чтобы показать, насколько серьезными могут быть результаты и почему профилактические меры (такие как обширное тестирование программного обеспечения) действительно необходимы.

Вам также может понравиться: Что мы можем извлечь из ошибок программного обеспечения

Потеря данных в Gitlab

Два года назад известная платформа для совместной работы с кодами GitLab испытала серьезную потерю данных, которая, по-видимому, была одним из основных сбоев в мире ИТ. Изначально GitLab использовал только один сервер баз данных, но решил протестировать решение с использованием двух серверов. Они планировали скопировать данные из производственной среды в тестовую среду.

В процессе автоматические механизмы начали удалять учетные записи из базы данных, которые были определены как опасные. В результате увеличения трафика процесс копирования данных начал замедляться, а затем полностью остановился из-за расхождений в данных. Чтобы добавить оскорбление раны, информация из производственной базы данных была удалена во время процесса копирования.

После нескольких попыток возобновить процесс один из сотрудников решил удалить тестовую базу и снова запустить процесс, но случайно удалил производственную базу. Еще хуже то, что каталог, содержащий копии, тоже был пустым – резервные копии долгое время не создавались из-за ошибки конфигурации.

То, что означало стандартную процедуру, привело к 18-часовому отключению, в то время как 300 ГБ данных о клиентах были потеряны. По оценкам GitLab, компания потеряла данные как минимум о 5000 новых проектах, 5000 комментариях и 700 пользователях. Подход компании к этому провалу заслуживает уважения.

Gitlab подробно объяснил, что произошло, транслировал процедуру восстановления на YouTube и опубликовал список улучшений, чтобы эта проблема больше никогда не повторилась. Но как говорится – ущерб нанесен.

British Airways «Технический выпуск»

Этим летом авиакомпания-флагман Великобритании – British Airways – сообщила о проблеме с ИТ-системой, которая привела к задержке сотен рейсов в Великобритании, в то время как десятки рейсов были полностью отменены. Этот сбой затронул три британских аэропорта и тысячи пассажиров, которым пришлось перебронировать свои рейсы или зарегистрироваться, используя ручные системы. Несмотря на решаемую проблему, аэропорты еще долго ощущали последствия этого сбоя, прежде чем возобновилось нормальное обслуживание.

Эта проблема с компьютерами в British Airways является последней в ряду ИТ-проблем авиакомпании. В прошлом году British Airways была приговорена к рекордному штрафу в 200 миллионов евро за нарушение данных. Это произошло из-за кибер-взлома, который привел к сбою сайта, ставящему под угрозу данные 500 тысяч клиентов. British Airways также столкнулась с серьезным отказом системы в 2017 году, который затронул 75 000 пассажиров и обошелся компании почти в 80 миллионов фунтов.

British Airways – не единственная авиакомпания, которая борется с проблемами программирования. В 2013 году American Airlines была вынуждена прекратить все свои полеты из-за компьютерного сбоя. А в 2017 году у компании было более 1000 рейсов с риском отмены. Планы многих путешественников во время курортного сезона могут быть разрушены из-за единственной ошибки во внутренней системе планирования компании, которая дала слишком большому количеству пилотов выходной.

Amazon AWS Outage

Когда речь идет о сбоях в ИТ, никто не застрахован. AWS Amazon, который считается одной из самых надежных услуг хостинга, в 2017 году испытал серьезное отключение на восточном побережье США.

Инфраструктура AWS поддерживает миллионы сайтов, а это означает, что, когда серверы компании выходят из строя, это создает много проблем во всем Интернете. Неудивительно, что «основные технические трудности» ASW привели к беспрецедентным проблемам для сотен популярных веб-сайтов.

Многие компании разных размеров и из разных отраслей хранят свои данные в дата-центрах AWS. Это включает в себя такие известные имена, как Netflix, Slack, Business Insider, IFTTT, Nest Trello, Quora и Splitwise. Многие из них были затронуты отключением, упомянутым выше.

Многие веб-сайты были полностью отключены, устройства в Интернете, такие как элементы управления освещением IFTTT или термостаты Nest, отказывались работать, помощник Amazon Алекса боролся за то, чтобы оставаться в сети, даже страница статуса Amazon AWS больше не работала. Это указывает на одну вещь – поскольку все больше и больше сервисов полагаются на хорошую репутацию AWS и переносят свои веб-сайты на свои серверы, даже небольшие сбои в одном центре обработки данных становятся действительно большой проблемой.

Google Plus Security Glitch

Уязвимость в Google+ раскрыла личную информацию почти 500 000 человек, использующих социальную сеть в период с 2015 по март 2018 года. Согласно отчету Wall Street Journal, основная часть проблемы заключалась в особом API, который можно использовать для получения доступа. на непубличную информацию.

Сбой программного обеспечения позволил сторонним разработчикам увидеть имя, адрес электронной почты, статус занятости, пол и возраст пользователей сети. Ошибка была обнаружена в марте 2018 года и немедленно исправлена.

Интересная часть – Google не поделился информацией об ошибке в Google+ сразу, пытаясь не попасть в центр внимания скандала с Cambridge Analytica и стать заметным для регуляторов.

В то же время в отчете WSJ говорится, что, хотя у Google нет доказательств злоупотребления данными, он также не может сказать, что их не было. В любом случае, техническая негативная реакция для Google+ закончилась печально – потребительская версия сети была вскоре закрыта.

Утечка данных пользователя Facebook

В прошлом году Facebook, чья способность обрабатывать конфиденциальную информацию уже была подвергнута сомнению, подтвердила, что около 50 миллионов учетных записей могут подвергаться риску. Хакеры воспользовались уязвимостью в системе, которая позволила им получить доступ к учетным записям и, возможно, к личной информации пользователей Facebook.

Атака была обнаружена 25 сентября 2018 года. Согласно источникам The New York Times, три программных уязвимости в сетевых системах позволили хакерам получить доступ к учетным записям пользователей, включая Марка Цукерберга, генерального директора Facebook.

Представители социальных сетей заявили, что хакеры, вероятно, использовали уязвимость в коде «Просмотреть как», функцию, которая позволяет проверить, как профиль выглядит с точки зрения других людей. Это, в свою очередь, привело к получению токенов аутентификации, благодаря которым пользователю не нужно каждый раз заходить на сайт. 90 миллионов пользователей вышли из своих учетных записей в день обнаружения уязвимости.

Представители Facebook пояснили, что в качестве превентивной меры было отключено еще 40 миллионов учетных записей. Тогда это нарушение данных было крупнейшим в истории Facebook. По новым Отчет UpGuardболее 540 миллионов записей пользователей Facebook в конечном итоге были выставлены на облачные серверы Amazon.

Может ли тестирование программного обеспечения предотвратить сбои программных решений для бизнеса?

Перечисленные выше случаи служат напоминанием о важности ИТ гарантия качества любого типа программного обеспечения. Они подчеркивают необходимость разработки эффективного подхода к тестированию как важнейшей части бизнес-процессов.

Сложность современных систем настолько велика, что обычно практически невозможно выполнить один конкретный тест и гарантировать идеальный результат. В большинстве случаев только комбинация ручное тестирование и автоматизированное тестирование позволяет вывести отличный продукт на рынок.

Важно подчеркнуть; Тем не менее, тестирование должно быть адаптировано к приоритетам бизнеса. Некоторые модули программного обеспечения часто подвержены ошибкам, поэтому требуют большего внимания специалистов по обеспечению качества. Процедуры тестирования также должны быть адаптированы к тестируемой системе. Потому что проблемы безопасности в одних системах гораздо важнее других. Поэтому тесты должны быть контекстными и адаптированными к окружающей среде.

Усилия по тестированию должны начаться как можно раньше в жизненном цикле программного обеспечения. Никто не станет утверждать, что стоимость устранения программных ошибок в процессе разработки значительно ниже, чем стоимость решения проблем, когда ущерб (для клиента и репутации компании) уже нанесен.

Подробная и эффективная стратегия тестирования сводит к минимуму вероятность ошибок в конечном продукте, которые могут привести к негативным последствиям для вашего бизнеса.

Дальнейшее чтение

Software Fail Watch: самые интересные ошибки Q1, 2018

Принцип быстрого отказа в разработке программного обеспечения

Топ 5 программных глюков и нарушений 2018 года