Поиск по сайту Поиск

Глубокое обучение и безопасность полётов

Статистика несчастных случаев показывает, что около половины авиакатастроф происходят в конце полёта — во время захода на посадку и самой посадки. Одна из основных причин аварий — нерациональное использование энергии, часто приводящее к потере управления, удару хвостом о взлётно-посадочную полосу, жёсткой посадке и прочим нештатным ситуациям. В этой статье мы расскажем, как исследователи из НАСА анализируют авиационные инциденты для своевременного выявления рисков и увеличения безопасности полётов.

Анализ авиационных происшествий


Под энергией воздушного судна подразумевается вид удельной энергии, применяемой для анализа траектории полёта самолётов и ракет. Она зависит от веса, скорости полёта, высоты, тяги, подъёма и сопротивления. Всё это требует тщательного контроля со стороны экипажа, задача которого — не допустить возникновения опасных инцидентов.


Анализ происшествий, связанных с безопасностью полётов, важен во многих ситуациях. Например, работающий на коммерческую авиакомпанию аналитик заинтересован в поиске первопричин этих инцидентов. Результаты его работы помогут повысить надёжность полётов, информировать о необходимости профилактического обслуживания, отслеживать человеческие факторы для улучшения обучения пилотов и так далее.

Сейчас инциденты безопасности полётов анализируются вручную: группа экспертов исследует вызвавшие их причины, произошедшие в полёте. Но такой подход теряет свою эффективность с ростом объёма данных. В одном только Национальном воздушном пространстве США выполняется более 15 миллионов регулярных пассажирских рейсов в год. За 1000 рейсов на короткие и средние расстояния происходит около 900 инцидентов по регулированию безопасности*. И эти цифры постоянно растут!


*Статистика основана на данных, полученных НАСА от пожелавшей остаться неизвестной авиакомпании. Указанные здесь инциденты подпадают под степень опасности 2 и 3, в то время как 1 степень часто игнорируется, поскольку является самой низкой. Также обратите внимание, что не все инциденты одинаково влияют на безопасность полётов.


Поэтому специалисты из НАСА решили разработать систему, которая будет анализировать данные полёта в автоматическом режиме. Для определения ключевых событий в наборах данных они предложили использовать прекурсоры (предшественники). Прекурсор — это любое связанное с инцидентом и предшествующее ему событие. Прекурсоры помогают понять основные причины инцидента и предпринять необходимые меры. Их изучение даёт ответы на вопросы: «Когда появилось опасное состояние?» «Что такое опасное состояние?» «Существуют ли корректирующие операции для его устранения?» «Какова вероятность того, что произойдёт инцидент?»

Предложенный метод использовался для определения прекурсоров при непредвиденном превышении скорости самолёта (авиационный инцидент). Рассмотрим подробнее, как с помощью прекурсоров можно анализировать такие происшествия. На рисунке ниже показан этап посадки самолёта.

На расстоянии около 40 километров от взлётно-посадочной полосы большинство датчиков показывали нормальные значения — состояние было безопасным и вероятность инцидента близка к нулю. Приблизившись к высоте 750 метров на расстоянии 20 км самолёт стал поворачивать, чтобы выровняться относительно полосы, и тогда было установлено слишком высокое значение скорости. Прекурсором к этому событию является увеличение вероятности авиационного инцидента. К высоте 600 метров скорость была скорректирована (уменьшена). На это указывает падение вероятности неблагоприятного события. Однако начиная с 450 метров вероятность снова растёт, поскольку задерживается выпуск закрылок. Из-за этого скорость полёта снова становится высокой при приближении к отметке высоты 300 метров, на которой было отмечено происшествие. Таким образом можно обобщить данные полёта и дать объяснение ключевым событиям, случившимся до инцидента.

Поиск прекурсоров — задача обучения с незначительным привлечением учителя (weakly supervised learning). Обычно у нас есть доступ к метке, которая указывает на происшествие, связанное с безопасностью полёта. Эту метку можно извлечь из системы отчётности по безопасности полётов (aviation safety reporting system, ASRS), где члены лётного экипажа и авиадиспетчеры сообщают о происшествиях; или же из автоматически генерируемых отчётов о полётах. Хотя у нас есть метка инцидента, метки для прекурсоров обычно недоступны, что усложняет задачу. Чтобы решить эту проблему, исследователи из НАСА предложили использовать многовариантное обучение (Multiple-Instance Learning, MIL), которое с помощью меток инцидента выводит метки прекурсоров с временным шагом.

MIL обычно использует набор данных, сгруппированных в виде пакетов. Метки пакетов известны, но неизвестны метки отдельных объектов. Задача MIL — обучить модель для прогнозирования меток пакетов или меток объектов (или и тех и других). Обычно делается предположение, связывающее метки пакетов с отдельными экземплярами: если в пакете есть хотя бы один положительный объект, то пакет помечается как положительный (положительный = указывающий на авиационный инцидент). Если же все экземпляры отрицательные, то пакет считается отрицательным. В стандартной формулировке не учитывается временная связь между объектами, поэтому исследователи создали новую модель глубокого временного многовариантного обучения (deep temporal MIL, DT-MIL) для расширения структуры MIL и добавления временных рядов. Этот подход также можно применять для очень больших наборов данных с использованием параллелизма графических процессоров.

Основная идея

Единственное доступное наблюдение для решения задачи MIL — общие данные о полёте, в которых указывается, произошёл ли авиационный инцидент. Цель — используя эту высокоуровневую информацию (метки пакетов данных) идентифицировать связанные с инцидентом события низкого уровня (метки отдельных объектов), произошедшие во время полёта. Поскольку полёт продолжается в течение определённого конечного периода, все события коррелируют друг с другом во времени. Их динамика часто бывает неравномерной: например, раскрытие дросселя за миллисекунды меняет частоту вращения двигателя, в то время как на определение заметного увеличения скорости полёта требуется несколько секунд. Или если неожиданно меняется ветер, требуется гораздо больше времени, чтобы увидеть его влияние на поведение самолёта. Поэтому важно рассматривать отдельные объекты данных вместе с контекстом.

На рисунке показана предложенная исследователями НАСА идея, согласно которой каждый полёт — это временной ряд с меткой пакета, указывающей на наличие или отсутствие авиационного инцидента. Отдельные объекты определяются как события, произошедшие в определённый момент времени T с учётом всех предыдущих (прекурсоров).

Модель DT-MIL

Как сказано выше, DT-MIL используется для поиска прекурсоров. Чтобы эффективно моделировать отдельные объекты, применяется специальный тип рекуррентных нейронных сетей с управляемыми рекуррентными блоками (Gated Recurrent Units, GRU). GRU похожи на блоки долгой краткосрочной памяти (long short-term memory, LSTM), но имеют более простую структуру. Это позволяет уменьшить объём вычислений и упростить реализацию модели.

Архитектура DT-MIL схематично изображена на рисунке ниже. Данные временного ряда (Xi) обрабатываются блоками GRU, которые преобразуют их скрытые состояния и передают на полносвязные слои (fully connected layers, FCL). Рекуррентные слои (RNN) фиксируют временные зависимости между объектами, а полносвязные слои используются для расширения возможностей аппроксимации. Логистический слой извлекает вероятности объектов, которые затем объединяются в слое агрегации для получения метки пакета. Модель можно обобщить для нескольких меток, если использовать множество независимых логистических слоёв, за которыми будут следовать слои агрегации MIL для каждого класса.

Прототип DT-MIL построен с помощью TensorFlow. В качестве оптимизатора использовался ADAM со скоростью обучения 0.002. Ко всем параметрам модели применялась регуляризация L2 с коэффициентом 0.01.

Эксперименты

Набор данных

Для исследования применялись данные, полученные с помощью метода обеспечения качества полётов (Flight Operational Quality Assurance, FOQA) за период с апреля 2010 года по октябрь 2011 года. Информацию предоставила пожелавшая остаться неизвестной частная авиакомпания. Данные содержат показания большинства сенсорных измерений на борту: скорость полёта, высота, тяга, мощность двигателя, расход топлива, тангаж, крен, давление, температура и многие другие. Частота выборки составляет 1 Гц. Чтобы устранить изменчивость характеристик самолёта, рассматриваются только модели Airbus A319 и A320.

Авиационный инцидент

В работе исследователей НАСА в качестве авиационного инцидента и рассматривается значительное превышение скорости (high-speed exceedance, HSE). Он определяется как:

скорость полёта на высоте 300 м (в контексте) > целевая скорость (в контексте)  + допуск

Временной контекст включает в себя одну морскую милю траектории полёта по обе стороны от контрольной точки в 300 метров. Это помогает идентифицировать полёты, в которых действительно наблюдалось устойчивое превышение скорости и игнорировать зашумлённые данные. Если указанное выражение выполняется, то полёт помечается положительной меткой с авиационным инцидентом HSE.

Обучение модели

Модель обучалась на описанных выше данных, которые случайным образом разделены на обучающую, проверочную и тестовую выборки в пропорциях 50%, 30% и 20% соответственно. Данные были нормализованы, чтобы иметь нулевое среднее и единичную дисперсию.

Результаты

Количественные результаты

Для сравнительной оценки используются следующие базовые модели:

  1. MI-SVM: модель на основе метода опорных векторов, являющаяся наиболее близкой по своей реализации к DT-MIL. Она помечает пакеты как положительные и отрицательные так же, как описано в разделе «Основная идея».
  2. MI-SVM (с привязкой ко времени): в отличие от обычной MI-SVM здесь учитывается временная связь между объектами.
  3. DT-MIL (без привязки ко времени): не содержит в себе рекуррентные блоки GRU.
  4. DT-MIL (неглубокая): не содержит полносвязных слоёв.
  5. ADOPT: алгоритм автоматического обнаружения прекурсоров во временных рядах (automatic discovery of precursors in time series, ADOPT) из предыдущей работы НАСА. Работает на основе обучения с подкреплением.

Количественные результаты показаны в таблице. В качестве метрики используется область под ROC-кривой (area under the receiver operating characteristic, AUC).

МоделиAUC обученияAUC тестирования
DT-MIL
DT-MIL (без привязки ко времени)
DT-MIL (неглубокая):
0.9904
0.9723
0.9892
0.9837
0.9447
0.9789
MI-SVM
MI-SVM (с привязкой ко времени)
0.8052
0.8751
0.79825
0.8802
ADOPT0.93730.8280

Видно, что предложенная DT-MIL модель достигает высокой точности в прогнозировании неблагоприятных событий. Её варианты без привязки ко времени и полносвязных слоёв также достигают неплохих результатов, превосходя MI-SVM и ADOPT.

Заключение

На этом работа исследователей не заканчивается. В дальнейшем они планируют провести более тонкую настройку модели и разработать с её помощью приложения, способные повысить безопасность полётов. Среди них: система принятия решений для лётного экипажа и авиадиспетчеров, а также конвейер обработки данных в реальном времени. Они помогут аналитикам, пилотам и диспетчерам оперативно реагировать на происшествия и избегать возможных проблем ещё на этапе обучения персонала и проектирования самолётов.

Если вы планируете разрабатывать своё решение с использованием глубокого обучения и хотите ускорить процесс вычислений — воспользуйтесь высокоскоростными GPU NVIDIA Tesla V100 на наших облачных серверах (от 90 рублей в час).

С оригинальной статьёй можно ознакомиться на сайте arxiv.org.

Стэнфордский курс: лекция 4. Введение в нейронные сети

Стэнфордский курс: лекция 4. Введение в нейронные сети

В прошлый раз мы выяснили, как работает функция потерь и оптимизация, а также рассказали о пользе градиента и градиентного спуска....
Read More
Данные на замке: как двухфакторная аутентификация поможет обезопасить сайт

Данные на замке: как двухфакторная аутентификация поможет обезопасить сайт

Пароли, даже самые сложные, уже давно не препятствие для злоумышленников. В ответ на это владельцы сайтов всё чаще вводят второй...
Read More
Улучшаем графику в старых играх и видео с помощью нейросетей

Улучшаем графику в старых играх и видео с помощью нейросетей

Бывало ли с вами такое: вы решили скачать любимую компьютерную игру детства и ненадолго погрузиться в счастливые воспоминания. Установили её,...
Read More
Как создать сайт-портфолио для творческого проекта

Как создать сайт-портфолио для творческого проекта

Резьба по книгам, money art, тканевые скульптуры — искусство может принимать самые разные формы. А благодаря Интернету современные художники могут...
Read More
Нейросеть описывает мир незрячим людям

Нейросеть описывает мир незрячим людям

Голосовые ассистенты могут не только играть в «города» и рассказывать о погоде — они способны на гораздо большее! Например, помогать...
Read More
Экскурсии в дата-центр: как мы провели 300 человек на закрытый объект и почему нас уже не остановить

Экскурсии в дата-центр: как мы провели 300 человек на закрытый объект и почему нас уже не остановить

Отвлекитесь немного от экрана и посмотрите на вещи, которые вас окружают. Стол, кружка, лампа, смартфон, клавиатура — всё это материальные...
Read More
Стэнфордский курс: лекция 3. Функция потерь и оптимизация

Стэнфордский курс: лекция 3. Функция потерь и оптимизация

На прошлой лекции мы разобрались, как работает классификация изображений. Что же может «потеряться» в процессе и можно ли этого избежать?...
Read More
Как ИИ отслеживает небезопасное поведение водителей

Как ИИ отслеживает небезопасное поведение водителей

Искусственный интеллект может помочь каршеринговым сервисам и таксопаркам сделать поведение водителей на дороге безопаснее. Например, предупреждать их, если они отвлеклись...
Read More
Многозначная классификация с помощью Keras

Многозначная классификация с помощью Keras

Можно ли обучить нейросеть делать не один, а сразу несколько прогнозов? Этот вопрос возникает, когда нам необходимо классифицировать изображения по...
Read More
Большая игра, или Загадочная история домена SEX.COM

Большая игра, или Загадочная история домена SEX.COM

“The Internet is for porn” — так пелось в бродвейском мюзикле Avenue Q (пародия на «Улицу Сезам»). И, несмотря на то,...
Read More