ivdon3@bk.ru
В статье рассматриваются проблемы генерации и актуализации документации программного обеспечения с использованием больших языковых моделей. Представлен обзор существующих подходов, включая суммаризацию кода, систем использующих подходы дополненной генерации, ассистентов встроенных в среду разработки, выявлены их ограничения в части потери архитектурного контекста и возникновения структурных галлюцинаций. Предложена концепция графо-дополненной системы документирования, где «источником истины» выступает направленный граф знаний о коде, построенный путем статического анализа кода и анализа библиотечных зависимостей. Описан алгоритм построения графа, включающий извлечение узлов, анализ байт-кода библиотек и классификацию семантических связей. Эффективность подхода подтверждена экспериментальным внедрением на промышленном микросервисе, где система продемонстрировала способность корректно восстанавливать контекст и генерировать содержательную документацию без искажения фактов.
Ключевые слова: автоматическое документирование, большие языковые модели, граф знаний, дополненная генерация текста, статический анализ, семантический поиск, векторное представление, микросервисная архитектура, интерфейс структуры программы, байт-код
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации