Мультиагентный контроллер покрытия: метод глубокого обучения с подкреплением для решения задачи планирования пути покрытия в мультиагентных системах
Аннотация
Дата поступления статьи: 09.12.2025В работе представлен мультиагентный контроллер покрытия (Multi-Agent Coverage Controller – MACC) – специализированный метод глубокого обучения с подкреплением для решения задачи планирования пути покрытия в мультиагентных системах. Метод решает ключевые проблемы задачи планирования пути покрытия: редкие и шумные вознаграждения, высокую дисперсию градиента, сложность распределения заслуг между агентами и необходимость масштабирования на переменное число агентов. Метод интегрирует определенный набор механизмов: адаптивная ширина интервала обрезки, шлюзование модулированного преимущества, контрфактический базис централизованного критика и механизм многоголового самовнимания с маской присутствия. Представлены теоретические свойства метода, подтверждающие стабильность оптимизации и снижение дисперсии градиентных оценок. Проведен комплексный абляционный анализ, демонстрирующий вклад каждого механизма в координацию агентов, пространственное распределение траекторий и итоговую скорость покрытия. Эксперименты на наборе спутниковых карт показывают, что MACC достигает значительного увеличения полноты и скорости покрытия по сравнению с базовой конфигурацией, обеспечивая наилучшие результаты при одновременном использовании всех интегрированных механизмов.
Ключевые слова: мультиагентная система, планирование пути покрытия, глубокое обучение с подкреплением, адаптивная ширина интервала обрезки, шлюзование модулированного преимущества, контрфактический базис, механизм многоголового самовнимания, координация агентов