按出版年份查看杂志:

机器学习在SQL注入攻击检测中的应用

作者:刘绍廷;杨孟英;朱广全;袁媛

单位:河北机电职业技术学院

阅读量: 字体编码: 繁體

本文以结构化查询语言(SQL)为研究对象,利用词袋(Bo W)模型和词频-逆文档频率(TF-IDF)算法两种方法进行SQL语句向量化。文本向量化后,特征矩阵维数大大增加,很难在后面数据训练和预测中使用。为解决这个问题,对大量SQL注入攻击语句与用户正常输入的SQL语句进行研究分析,概括出28个特征关键词。同时,使用决策树、XGBoost和随机森林三个分类模型,对数据集进行模型训练及预测。实验结果表明:与词袋(Bo W)模型相比,词频-逆文档频率(TF-IDF)算法的准确率、召回率、F分数、精确率均提高了10%左右。此外,ROC曲线也说明了该方法的有效性。
DOI:
关键词:
Array
所属期刊栏目:
技术_信息技术
分类号:
TP393.08;TP181
页码:
23-27
© 2021 《河南科技》杂志社 版权所有    豫ICP备2020016010号-1      网站技术支持:网易科技有限公司