Грант РФФИ 19-29-06090 мк
Структурно-параметрический синтез, оценка эффективности, прогнозирование развития
и формирование технического облика систем обнаружения, локализации и противодействия беспилотных транспортных средств, несущих угрозу нормальному функционированию
«умного города».
Аннотация проекта
При реализации транспортной системы в рамках концепции «умного города» возрастает риск вмешательства в ее функционирование. Разработанная к настоящему времени большая номенклатура беспилотных транспортных средств и средств противодействия им требует более системного анализа.

Цель проекта — разработка методики синтеза структур систем обнаружения, локализации и противодействия беспилотному транспорту на основе математических и имитационных моделей сложных многоагентных систем.

Новизна исследования заключается в использовании методов машинного обучения с подкреплением совместно с генетическим алгоритмом при синтезе оптимальных структур таких систем. Этот подход позволит выявить также и тактики поведения как системы беспилотного транспорта, так и системы противодействия.

Основной ожидаемый результат — разработанная методика структурно-параметрического синтеза сложных технических систем противодействия организованному противнику на основе имитационного моделирования и машинного обучения.
Общий вид модели транспортной системы «умного города»
Компьютерная модель транспортной системы «умного города» с системами обнаружения, локализации и противодействия беспилотным транспортным средствам состоит из основного объекта транспортной системы «умного города» («сцены»), в котором размещаются все остальные модели объектов. Через «сцену» осуществляется взаимодействие различных объектов друг с другом. Компьютерная модель может быть построена с использованием агентно-ориентированного подхода совместно с подходом автоматного программирования, поскольку предполагается, что все агенты в модели имеют конечное число возможных состояний.
Состояния объектов меняются при наступлении событий из конечного множества всех возможных событий.
Стрелками со сплошной линией показаны связи между объектами системы.
Стрелками с пунктирной линией обозначены возможные связи наследования (в терминологии объектно-ориентированного программирования).
Основные научные результаты проекта
Имитационная модель гетерогенного транспортного потока на основе подхода клеточных автоматов
Разработана простая имитационная модель гетерогенной транспортной системы, состоящей из управляемых человеком и беспилотных транспортных средств. Эволюция системы во времени основана на модифицированной версии правила 184 Вольфрама для элементарного клеточного автомата. Предложены правила для различных пар следующих друг за другом транспортных средств (режимы следования за автомобилем). При этом учтено, что группа последовательно движущихся беспилотных транспортных средств, которые обмениваются информацией между собой, может образовывать кластер, движущийся с заданной скоростью. Исследовано влияние соотношения типов транспортных средств (управляемых человеком и беспилотных) в системе на характеристики транспортного потока. Показано, что предложенная упрощенная модель позволяет качественно описать основные черты неоднородного транспортного потока.

Публикации по теме:
Имитационная стохастическая клеточно-автоматная модель транспортного потока
с учетом скрытно противодействующих транспортных средств
Разработана имитационная стохастическая клеточно-автоматная модель движения по круговой двухполосной дороге. Модель основана на правилах S-NFS. В модели, помимо обычных машин, есть скрытно противодействующие машины. Их цель — уменьшить количественные показатели (например, поток трафика) транспортной системы с помощью специальных правил поведения. Исследованы три таких правила поведения: два правила смены полосы движения и одно правило замедления. Показано, что противодействующие транспортные средства могут влиять на транспортный поток преимущественно в области максимума основной диаграммы, то есть при средних значениях плотности транспортных средств. В условиях бездорожья или в пробке влияние противодействующего транспортного средства незначительно независимо от правил его поведения.

Публикации по теме:
Функция награды при обучении с подкреплением в задачах управления беспилотными летательными аппаратами
Разработана ​​новая функция награды, которую можно использовать для глубокого обучения с подкреплением в задачах управления и навигации беспилотными летательными аппаратами (БПЛА). Функция награды основана на построении и оценке времени упрощенных траекторий до цели, которые представлены кривыми Безье 3-го порядка. Эту функцию награды можно без изменений применять для решения задач как в 2D, так и в 3D средах. Эффективность функции награды оценивалась при симуляции в 2D пространстве, в котором описывалась динамика управления и полета БПЛА с учетом сил тяги, инерции, гравитации и аэродинамического сопротивления. В такой постановке были решены три задачи управления и навигации БПЛА: полет БПЛА в заданную точку пространства, уход от перехвата другим БПЛА и организация перехвата одного БПЛА другим.

Публикации по теме:
Алгоритм глубокого обучения с подкреплением на основе муравьиного алгоритма
для решения задачи роевого обучения
Предложен новый алгоритм глубокого обучения с подкреплением, который основан традиционном алгоритме оптимизации подражанием муравьиной колонии, для решения задачи кооперативного однородного роевого обучения. Алгоритм формирует коллективное поведение децентрализованной системы, которая состоит из набора независимых однородных агентов. Эти агенты локально взаимодействуют друг с другом и с окружающей средой. Локальные и часто случайные взаимодействия агентов в процессе централизованного обучения приводят к возникновению коллективного поведения роя агентов, которое не контролируется отдельными агентами в процессе реальной эксплуатации. Преимущества предложенного алгоритма исследованы в экспериментальной виртуальной среде StarCraft Multi-Agent Challenge.

Публикации по теме:
  • Bolshakov V., Alfimtsev A., Sakulin S., Bykov N. (2022) Deep Reinforcement Ant Colony Optimization for Swarm Learning // Kryzhanovsky B., Dunin-Barkowski W., Redko V., Tiumentsev Y., Klimov V.V. (eds) Advances in Neural Computation, Machine Learning, and Cognitive Research V. NEUROINFORMATICS 2021. Studies in Computational Intelligence, vol 1008. Springer, Cham.
Имитационная модель физического противодействия беспилотным летательным аппаратам
Разработана простая имитационную модель взаимодействия автоматических пушек с невооруженными дронами (беспилотными летательными аппаратами). Каждый дрон в модели представляет собой твердое тело, состоящее из нескольких простых тел типа параллелепипедов, эллипсоидов и т. д. Упрощенная пространственная траектория дрона строится с помощью кривых Безье 3-го порядка. С помощью такого подхода можно быстро смоделировать относительно большую группу невзаимодействующих между собой дронов.
Автоматические пушки в модели — это агенты, стреляющие по дронам одиночными очередями относительно идеальной точки прицеливания. Проведено компьютерное моделирование полета нескольких дронов при противодействии им нескольких автоматических пушек для разных условий. Результат моделирования представлен в виде пространственного распределения вероятностей поражения дронов, распределения доли пораженных дронов в зависимости от количества орудий, влияния городских препятствий на долю пораженных дронов.

Публикации по теме:
Контакты
МГТУ им. Н. Э. Баумана
Москва, Госпитальный переулок, 10
Телефон: +7 495 263-64-51
Email: hello@inteltransys.ru