Решение проблемы дефицита размеченных промышленных данных через синтетическую генерацию облаков точек для обучения глубоких нейросетей семантической сегментации
Аннотация
Дата поступления статьи: 03.01.2026В статье представлена методология решения проблемы дефицита размеченных промышленных данных для обучения глубоких нейросетей семантической сегментации. Предложена платформа синтетической генерации обучающих выборок облаков точек на основе минимального числа реальных сканов лазерного зондирования инженерных сетей. Алгоритм включает детектирование осей цилиндрических элементов методом случайного консенсуса, построение перпендикулярных плоскостей стыков и применение аффинных преобразований для создания сборок из 2–7 элементов. Обучающая выборка увеличена с 8 реальных сканов до 800+ синтетических примеров, что позволило повысить точность сегментации архитектуры глубокого иерархического обучения на облаках точек PointNet++ с 72% до 89% по метрике пересечения-объединения (Intersection over Union – IoU). Разработанная система обеспечивает автоматизированное создание BIM-моделей инженерной инфраструктуры с точностью 90–95% соответствия проектным параметрам.
Ключевые слова: синтетическая генерация данных, облака точек, семантическая сегментация, лазерное зондирование, метод случайного консенсуса, дефицит размеченных данных, BIM-моделирование, инженерные сети, глубокое обучение