ivdon3@bk.ru
В статье рассматривается проблема отбора признаков при обучении моделей машинного обучения в задаче идентификации поддельных (фишинговых) веб-сайтов. В качестве решения предлагается набор из ряда ключевых метрик: эффективность, надёжность, отказоустойчивость и скорость извлечения. Подобный подход к оцениванию позволяет ранжировать признаки по категориям с последующим отбором для обучения моделей машинного обучения, в зависимости от специфики предметной области и ограничений.
Ключевые слова: метод оценивания признаков, модель машинного обучения, идентификация фишинговых веб-сайтов, метрика, эффективность, надёжность, отказоустойчивость, скорость извлечения
2.3.1 - Системный анализ, управление и обработка информации , 2.3.6 - Методы и системы защиты информации, информационная безопасность