Поиск по сайту Поиск

Глубокое обучение и безопасность полётов

Статистика несчастных случаев показывает, что около половины авиакатастроф происходят в конце полёта — во время захода на посадку и самой посадки. Одна из основных причин аварий — нерациональное использование энергии, часто приводящее к потере управления, удару хвостом о взлётно-посадочную полосу, жёсткой посадке и прочим нештатным ситуациям. В этой статье мы расскажем, как исследователи из НАСА анализируют авиационные инциденты для своевременного выявления рисков и увеличения безопасности полётов.

Анализ авиационных происшествий


Под энергией воздушного судна подразумевается вид удельной энергии, применяемой для анализа траектории полёта самолётов и ракет. Она зависит от веса, скорости полёта, высоты, тяги, подъёма и сопротивления. Всё это требует тщательного контроля со стороны экипажа, задача которого — не допустить возникновения опасных инцидентов.


Анализ происшествий, связанных с безопасностью полётов, важен во многих ситуациях. Например, работающий на коммерческую авиакомпанию аналитик заинтересован в поиске первопричин этих инцидентов. Результаты его работы помогут повысить надёжность полётов, информировать о необходимости профилактического обслуживания, отслеживать человеческие факторы для улучшения обучения пилотов и так далее.

Сейчас инциденты безопасности полётов анализируются вручную: группа экспертов исследует вызвавшие их причины, произошедшие в полёте. Но такой подход теряет свою эффективность с ростом объёма данных. В одном только Национальном воздушном пространстве США выполняется более 15 миллионов регулярных пассажирских рейсов в год. За 1000 рейсов на короткие и средние расстояния происходит около 900 инцидентов по регулированию безопасности*. И эти цифры постоянно растут!


*Статистика основана на данных, полученных НАСА от пожелавшей остаться неизвестной авиакомпании. Указанные здесь инциденты подпадают под степень опасности 2 и 3, в то время как 1 степень часто игнорируется, поскольку является самой низкой. Также обратите внимание, что не все инциденты одинаково влияют на безопасность полётов.


Поэтому специалисты из НАСА решили разработать систему, которая будет анализировать данные полёта в автоматическом режиме. Для определения ключевых событий в наборах данных они предложили использовать прекурсоры (предшественники). Прекурсор — это любое связанное с инцидентом и предшествующее ему событие. Прекурсоры помогают понять основные причины инцидента и предпринять необходимые меры. Их изучение даёт ответы на вопросы: «Когда появилось опасное состояние?» «Что такое опасное состояние?» «Существуют ли корректирующие операции для его устранения?» «Какова вероятность того, что произойдёт инцидент?»

Предложенный метод использовался для определения прекурсоров при непредвиденном превышении скорости самолёта (авиационный инцидент). Рассмотрим подробнее, как с помощью прекурсоров можно анализировать такие происшествия. На рисунке ниже показан этап посадки самолёта.

На расстоянии около 40 километров от взлётно-посадочной полосы большинство датчиков показывали нормальные значения — состояние было безопасным и вероятность инцидента близка к нулю. Приблизившись к высоте 750 метров на расстоянии 20 км самолёт стал поворачивать, чтобы выровняться относительно полосы, и тогда было установлено слишком высокое значение скорости. Прекурсором к этому событию является увеличение вероятности авиационного инцидента. К высоте 600 метров скорость была скорректирована (уменьшена). На это указывает падение вероятности неблагоприятного события. Однако начиная с 450 метров вероятность снова растёт, поскольку задерживается выпуск закрылок. Из-за этого скорость полёта снова становится высокой при приближении к отметке высоты 300 метров, на которой было отмечено происшествие. Таким образом можно обобщить данные полёта и дать объяснение ключевым событиям, случившимся до инцидента.

Поиск прекурсоров — задача обучения с незначительным привлечением учителя (weakly supervised learning). Обычно у нас есть доступ к метке, которая указывает на происшествие, связанное с безопасностью полёта. Эту метку можно извлечь из системы отчётности по безопасности полётов (aviation safety reporting system, ASRS), где члены лётного экипажа и авиадиспетчеры сообщают о происшествиях; или же из автоматически генерируемых отчётов о полётах. Хотя у нас есть метка инцидента, метки для прекурсоров обычно недоступны, что усложняет задачу. Чтобы решить эту проблему, исследователи из НАСА предложили использовать многовариантное обучение (Multiple-Instance Learning, MIL), которое с помощью меток инцидента выводит метки прекурсоров с временным шагом.

MIL обычно использует набор данных, сгруппированных в виде пакетов. Метки пакетов известны, но неизвестны метки отдельных объектов. Задача MIL — обучить модель для прогнозирования меток пакетов или меток объектов (или и тех и других). Обычно делается предположение, связывающее метки пакетов с отдельными экземплярами: если в пакете есть хотя бы один положительный объект, то пакет помечается как положительный (положительный = указывающий на авиационный инцидент). Если же все экземпляры отрицательные, то пакет считается отрицательным. В стандартной формулировке не учитывается временная связь между объектами, поэтому исследователи создали новую модель глубокого временного многовариантного обучения (deep temporal MIL, DT-MIL) для расширения структуры MIL и добавления временных рядов. Этот подход также можно применять для очень больших наборов данных с использованием параллелизма графических процессоров.

Основная идея

Единственное доступное наблюдение для решения задачи MIL — общие данные о полёте, в которых указывается, произошёл ли авиационный инцидент. Цель — используя эту высокоуровневую информацию (метки пакетов данных) идентифицировать связанные с инцидентом события низкого уровня (метки отдельных объектов), произошедшие во время полёта. Поскольку полёт продолжается в течение определённого конечного периода, все события коррелируют друг с другом во времени. Их динамика часто бывает неравномерной: например, раскрытие дросселя за миллисекунды меняет частоту вращения двигателя, в то время как на определение заметного увеличения скорости полёта требуется несколько секунд. Или если неожиданно меняется ветер, требуется гораздо больше времени, чтобы увидеть его влияние на поведение самолёта. Поэтому важно рассматривать отдельные объекты данных вместе с контекстом.

На рисунке показана предложенная исследователями НАСА идея, согласно которой каждый полёт — это временной ряд с меткой пакета, указывающей на наличие или отсутствие авиационного инцидента. Отдельные объекты определяются как события, произошедшие в определённый момент времени T с учётом всех предыдущих (прекурсоров).

Модель DT-MIL

Как сказано выше, DT-MIL используется для поиска прекурсоров. Чтобы эффективно моделировать отдельные объекты, применяется специальный тип рекуррентных нейронных сетей с управляемыми рекуррентными блоками (Gated Recurrent Units, GRU). GRU похожи на блоки долгой краткосрочной памяти (long short-term memory, LSTM), но имеют более простую структуру. Это позволяет уменьшить объём вычислений и упростить реализацию модели.

Архитектура DT-MIL схематично изображена на рисунке ниже. Данные временного ряда (Xi) обрабатываются блоками GRU, которые преобразуют их скрытые состояния и передают на полносвязные слои (fully connected layers, FCL). Рекуррентные слои (RNN) фиксируют временные зависимости между объектами, а полносвязные слои используются для расширения возможностей аппроксимации. Логистический слой извлекает вероятности объектов, которые затем объединяются в слое агрегации для получения метки пакета. Модель можно обобщить для нескольких меток, если использовать множество независимых логистических слоёв, за которыми будут следовать слои агрегации MIL для каждого класса.

Прототип DT-MIL построен с помощью TensorFlow. В качестве оптимизатора использовался ADAM со скоростью обучения 0.002. Ко всем параметрам модели применялась регуляризация L2 с коэффициентом 0.01.

Эксперименты

Набор данных

Для исследования применялись данные, полученные с помощью метода обеспечения качества полётов (Flight Operational Quality Assurance, FOQA) за период с апреля 2010 года по октябрь 2011 года. Информацию предоставила пожелавшая остаться неизвестной частная авиакомпания. Данные содержат показания большинства сенсорных измерений на борту: скорость полёта, высота, тяга, мощность двигателя, расход топлива, тангаж, крен, давление, температура и многие другие. Частота выборки составляет 1 Гц. Чтобы устранить изменчивость характеристик самолёта, рассматриваются только модели Airbus A319 и A320.

Авиационный инцидент

В работе исследователей НАСА в качестве авиационного инцидента и рассматривается значительное превышение скорости (high-speed exceedance, HSE). Он определяется как:

скорость полёта на высоте 300 м (в контексте) > целевая скорость (в контексте)  + допуск

Временной контекст включает в себя одну морскую милю траектории полёта по обе стороны от контрольной точки в 300 метров. Это помогает идентифицировать полёты, в которых действительно наблюдалось устойчивое превышение скорости и игнорировать зашумлённые данные. Если указанное выражение выполняется, то полёт помечается положительной меткой с авиационным инцидентом HSE.

Обучение модели

Модель обучалась на описанных выше данных, которые случайным образом разделены на обучающую, проверочную и тестовую выборки в пропорциях 50%, 30% и 20% соответственно. Данные были нормализованы, чтобы иметь нулевое среднее и единичную дисперсию.

Результаты

Количественные результаты

Для сравнительной оценки используются следующие базовые модели:

  1. MI-SVM: модель на основе метода опорных векторов, являющаяся наиболее близкой по своей реализации к DT-MIL. Она помечает пакеты как положительные и отрицательные так же, как описано в разделе «Основная идея».
  2. MI-SVM (с привязкой ко времени): в отличие от обычной MI-SVM здесь учитывается временная связь между объектами.
  3. DT-MIL (без привязки ко времени): не содержит в себе рекуррентные блоки GRU.
  4. DT-MIL (неглубокая): не содержит полносвязных слоёв.
  5. ADOPT: алгоритм автоматического обнаружения прекурсоров во временных рядах (automatic discovery of precursors in time series, ADOPT) из предыдущей работы НАСА. Работает на основе обучения с подкреплением.

Количественные результаты показаны в таблице. В качестве метрики используется область под ROC-кривой (area under the receiver operating characteristic, AUC).

МоделиAUC обученияAUC тестирования
DT-MIL
DT-MIL (без привязки ко времени)
DT-MIL (неглубокая):
0.9904
0.9723
0.9892
0.9837
0.9447
0.9789
MI-SVM
MI-SVM (с привязкой ко времени)
0.8052
0.8751
0.79825
0.8802
ADOPT0.93730.8280

Видно, что предложенная DT-MIL модель достигает высокой точности в прогнозировании неблагоприятных событий. Её варианты без привязки ко времени и полносвязных слоёв также достигают неплохих результатов, превосходя MI-SVM и ADOPT.

Заключение

На этом работа исследователей не заканчивается. В дальнейшем они планируют провести более тонкую настройку модели и разработать с её помощью приложения, способные повысить безопасность полётов. Среди них: система принятия решений для лётного экипажа и авиадиспетчеров, а также конвейер обработки данных в реальном времени. Они помогут аналитикам, пилотам и диспетчерам оперативно реагировать на происшествия и избегать возможных проблем ещё на этапе обучения персонала и проектирования самолётов.

Если вы планируете разрабатывать своё решение с использованием глубокого обучения и хотите ускорить процесс вычислений — воспользуйтесь высокоскоростными GPU NVIDIA Tesla V100 на наших облачных серверах (от 90 рублей в час).

С оригинальной статьёй можно ознакомиться на сайте arxiv.org.

Domains weekly: месть Амазонии, победа Доткома и новости с полей битвы за .ORG

Domains weekly: месть Амазонии, победа Доткома и новости с полей битвы за .ORG

В очередном еженедельном дайджесте мы расскажем о протесте стран Амазонии против Amazon, выигранном споре за непродлённый вовремя домен и новых...
Read More
Support-гид: поиск ответов на вопросы по услугам REG.RU

Support-гид: поиск ответов на вопросы по услугам REG.RU

Что делать, когда возникает вопрос по работе сайта или онлайн-проекта? Можно попробовать найти решение в Google — но если проблема...
Read More
Domains weekly: конец стабильности .COM, детали продажи .ORG и сделки недели

Domains weekly: конец стабильности .COM, детали продажи .ORG и сделки недели

Из нового доменного дайджеста вы узнаете, может ли проигрыш спора за домен стать победой, чего ждать от повышения цен на...
Read More
PHP 7 или Как ускорить сайт за минуту без регистрации и СМС

PHP 7 или Как ускорить сайт за минуту без регистрации и СМС

Вы наверняка в курсе, что PHP удерживает лидерство среди языков, применяющихся для создания сайтов. В конце 2019 года версия PHP...
Read More
Приключенческая игра с самым опасным ИИ в мире

Приключенческая игра с самым опасным ИИ в мире

Долгие праздничные каникулы уже позади, но многим наверняка хочется ещё немного отдохнуть от серьёзных тем. Поэтому сегодня мы расскажем вам...
Read More
Новогодний чек-лист: не пропразднуй свой домен

Новогодний чек-лист: не пропразднуй свой домен

Не все задачи и дела подходят под фразу «А давайте уже после праздников». И те, что «горят прям горят», мы...
Read More
Domains weekly: рост Интернета, зона .AMAZON и домен на миллион

Domains weekly: рост Интернета, зона .AMAZON и домен на миллион

Приближаются праздники, и в доменной индустрии всё становится спокойнее… Или нет? Из последней подборки в этом году вы узнаете, насколько...
Read More
Итоги 2019 года в блоге REG.RU: создание сайтов, бэкапы, нейросети и UX‑дизайн

Итоги 2019 года в блоге REG.RU: создание сайтов, бэкапы, нейросети и UX‑дизайн

Год приближается к финишной прямой, и редакция блога, следуя тренду, подводит его итоги. Сегодня мы поделимся материалами, которые вы больше...
Read More
Стэнфордский курс: лекция 10. Рекуррентные нейронные сети

Стэнфордский курс: лекция 10. Рекуррентные нейронные сети

В прошлый раз мы рассказали о нескольких популярных свёрточных архитектурах и узнали об их влиянии на развитие машинного обучения. В...
Read More
Domains weekly: карта Интернет-мира, перспективы Китая и доменная зависть

Domains weekly: карта Интернет-мира, перспективы Китая и доменная зависть

Новая подборка новостей будет очень полезной для домейнеров. Насколько активно страны мира регистрируют сайты в своих национальных доменных зонах? Есть...
Read More