- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
队伍编号
dsa2400271
题号
(B)
应用集成机器学习对电信银行卡诈骗的数据分析研究
摘要
现阶段电信银行卡诈骗问题日益严峻,对个人财产安全和社会稳定构成了严重威胁。为此本文通过综合运用相关性分析、灰色关联分析、集成机器学习以及Stacking模型融合方法,借助MATLAB和SPSS等工具,深入探究了电信诈骗的分布特征及其指标间的关联性。本研究不仅量化了各个特征对电信诈骗的影响程度,还特别分析了银行卡转账是否为同银行及是否为线上交易这两个关键特征与诈骗行为的显著联系。此外,本文还对电信银行卡诈骗进行了有效预测,从而在实践应用中降低诈骗发生的概率,对维护社会秩序,以及保障公民财产安全具有一定参考价值。
为提高数据的精度,首先本文对电信银行卡交易数据集进行预处理,包括识别并处理样本不均衡问题、探索性分析以及特征的分箱和编码。其次,进行数据结构优化和归一化。然后基于不平衡数据采用SMOTE过采样技术进行平衡,并通过逻辑回归算法评估原始与过采样后的数据集分类效果,最终确定采用优化后的采样数据。
针对问题1,发生电信银行卡诈骗数据的绘图分析。首先本文通过数据可视化技术绘制扇形图和柱状图,深入分析了电信银行卡诈骗的分布和特点,其中“有无发生电信银行卡诈骗”比例见REF_Ref169078920\h图5,线上和线下诈骗案例的数量对比见REF_Ref169079160\h图6。之后进一步分析探讨了诈骗行为的分布特征、发展趋势及其对用户行为和银行安全策略的影响。
针对问题2,评估发生电信诈骗的指标特征之间的关联性。本文利用灰色关联分析法,通过针对电信诈骗案例中“使用银行卡设备转账”和“使用银行卡PIN码转账”两个指标,评估了它们与电信诈骗发生的关联性,发生电信诈骗的关联程度效果见REF_Ref166368531\h图7,发生电信诈骗的概率分布见表9,结果显示使用银行卡在设备上进行转账交易的情况下更容易发生电信诈骗,同时使用PIN的转账交易在电信诈骗的概率上降低了0.09%。
针对问题3,发生电信诈骗指标之间的相关性探究。本文首先对采用SMOTE技术优化后的数据集采用相关性分析对特征指标影响程度进行量化,之后使用Kendall’sW检验对模型进行优化处理,结果显示总体数据的显著性P值为0.000***,Kendall协调系数??值为0.817,因此相关性的程度为高度的一致性。最后绘制Spearman秩相关系数和Kendall秩相关系数热力图见REF_Ref166345958\h图9,数据结果显示Distance1、Ratio、Repeat和Online与电信诈骗的发生具有较强的正相关性,而Card和Pin则显示出负相关性。此外,发生电信银行卡诈骗的显著程度见REF_Ref169083119\h表10。
针对问题4,基于电信银行卡诈骗的预测分析。首先,本文在问题3相关性分析模型计算结果的基础上,通过建立基于集成机器学习对电信银行卡诈骗的预测模型,分别使用GBDT、XGBoost、RUSBoost算法对电信银行卡诈骗进行预测。其次,通过stacking的方法进行模型融合,同3种基学习器对比得出最优解见REF_Ref169089489\h表12-13。其中stacking融合模型的F1得分在四个分类器中最高,均达到0.98以上,说明stacking融合模型对电信银行卡诈骗的预测方面具有较高的泛化能力,从训练效果发现融合后的模型比单独的基学习器效果更好。最后基于研究成果,分别向公安部门、银行和市民们提出了一份建议。
最后,本文针对电信银行卡诈骗预测模型进行了灵敏度检验和测试模型的鲁棒性,用于进一步提高模型的精准度。
关键词:电信诈骗;相关性分析;灰色关联分析;机器学习;Stacking融合
目录
TOC\o1-2\h\z\u1问题重述 1
1.1研究背景与意义 1
1.2文献综述 1
1.3研究选题 2
2研究思路 2
3模型假设 3
4符号说明 3
5数据的预处理 4
5.1样本数据的处理 4
5.2数据集特征探索 5
5.3样本数据的结构优化 7
6问题1:发生电信银行卡诈骗数据的绘图分析 10
6.1模型的建立与求解 10
6.2结果分析 10
7问题2:确定发生电信诈骗的指标特征 12
7.1灰色关联分析模型的建立与求解 12
7.2结果分析 13
8问题3:发生电信诈骗指标之间的相关性探究 14
8.1模型的建立与求解 14
8.2结果分析 15
8.3Kendall’sW检验 16
9
您可能关注的文档
- gbdt分类数学建模竞赛.docx
- Spearman相关性分析数学建模竞赛.docx
- Kendall一致性检验数学建模竞赛.docx
- Kendall's tau-b相关性分析数学建模竞赛.docx
- RUSBoost数学建模竞赛.docx
- xgboost分类数学建模竞赛.docx
- 基于SICAS模型的佳帮手直播营销策略优化研究_王冰.pdf
- 正态性校验数学建模竞赛.docx
- A题优秀论文-5数学建模竞赛.pdf
- 描述性统计数学建模竞赛.docx
- 电商直播情境下顾客感知价值和在线购买意愿的影响研究_付天娇.pdf
- icc组内相关系数.docx
- 灰色关联分析.docx
- 客户价值划分(RFM)_Linsear Write Formula_Quantity_Price.docx
- 【数据统计分析方向】直播带货与电商产品的大数据分析.docx
- 线性回归(最小二乘法).docx
- 2024年第十四届APMCM亚太地区大学生数学建模竞赛(中文赛项)参赛纪律和论文提交方式说明.pdf
- B题 洪水灾害的数据分析与预测.docx
- 2024年第十四届APMCM亚太地区大学生数学建模竞赛(中文赛项)承诺书.docx
- 2024年第十四届APMCM亚太地区大学生数学建模竞赛(中文赛项)承诺书.pdf
最近下载
- 冬季用电用火安全主题班会.pptx VIP
- 2025年证券公司高级管理人员水平评价测试历年参考题库含答案详解(5套).docx VIP
- FST-3000浮筒变送器讲义.pdf VIP
- 第七章 超声波传感器PPT参考课件.ppt VIP
- 国家开放大学《药剂学》形考任务1-3参考答案.docx VIP
- 员工创新激励机制方案.docx VIP
- DB15∕ 258-2008 内蒙古自治区道路交通事故认定(内蒙古自治区).pdf VIP
- 第一单元《华夏古韵》——阳关三叠 教学设计-2023—2024学年人教版初中音乐八年级下册教案1000字.docx VIP
- 2025版网络信息安全知识培训(必威体育精装版版) .pdf VIP
- 高中政治课堂生成式AI创设情境对学生政治认同感培养的实践研究教学研究课题报告.docx
有哪些信誉好的足球投注网站
文档评论(0)