- 1、本文档共87页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
南京航空航天大学硕士学位论文
摘要
为了开发和交付高质量的软件产品,软件从业者通常采用各种各样的软件开发方法,例如
DevOps、Scrum或者Waterfall。当遇到软件开发方法相关的挑战时,软件从业者经常在Stack
Exchange问答网站上提出问题和寻找解决方案,StackExchange中包含着数以千万的软件从业者
提出的问题以及提供的答案,这些数据经常被用于软件工程中各个领域的研究,但是目前还没
有利用StackExchange上的数据,针对软件开发方法领域的研究。
本文的研究目标是利用StackExchange上积累的软件开发方法相关问题数据,系统性的调
查和分析软件开发方法相关问题的讨论主题以及影响问题未回答的各种特征因素,从而深入地
理解实践中的软件开发方法,并帮助软件从业人员改善问题质量,提高问题得到答案的可能性,
从而及时解决实践中面临的挑战。论文从StackExchange中收集到了13903条软件开发方法相关
问题,基于这些收集到的数据,本文的主要工作和贡献如下:
第一,本文利用StackExchange上的数据从软件从业者的角度深入全面的分析了软件开发
方法领域的讨论主题。我们首先使用主题模型LDA识别出了15个软件开发方法相关问题的讨
论主题,并分析了这些主题的发展趋势,其中问题数量最多的三个主题为“主题4:软件团队
以及时间的管理”、“主题2:领域驱动设计中的架构层”和“主题14:软件设计和需求”;通过
度量这些主题的流行度和困难度发现,困难度排名前三的主题的新增问题数量均呈现非常明显
的上升趋势,并且通过肯德尔等级相关系数发现主题流行度和主题困难度之间有着非常明显的
负相关性,即主题流行度随着主题困难度的上升而下降;我们还通过定性分析方法提取了49个
软件开发方法领域主要讨论的挑战并将它们总结成14个子主题和4个高阶的主题,其中“项目
管理挑战”的高阶主题中包含了6个与之相关的子主题,“团队管理挑战”和“概念和定义挑
战”这两个高阶主题中各自包含了3个与之相关的子主题,“工具和资源挑战”中包含了2个与
之相关的子主题。
第二,本文通过对软件开发方法相关问题中未回答问题与已回答问题之间的特征进行对比
定量和定性分析,研究影响问题未回答的各种特征因素,并提出了一种基于监督学习的问题回
答时间预测模型,以帮助软件从业者更好的利用StackExchange对软件开发方法相关问题进行
提问,从而克服软件开发方法实践中面临的挑战。我们首先通过分析软件开发方法相关问题的
回答状况与发展趋势,发现软件开发方法领域的新增问题一直呈现稳定上升趋势,但是“收到
被采纳答案的问题”却一直呈现出下降趋势,而“没有收到任何答案的问题”从2018年开始呈
现出非常明显的上升趋势;我们使用定量和定性分析方法研究了未回答问题和已回答问题之间
的特征差异,发现未回答问题所占比例最高的前三个主题均与软件开发方法中的工具支持有密
切的关系,并且未回答问题相对已回答问题复杂度更高,对于用户社区的吸引力更低,使用了
更少的单词数量,更多的非常用术语,缺少对问题的上下文详尽的描述,表达了更多的消极情
I
基于StackExchange数据的软件开发方法讨论和未回答问题研究
绪;而已回答问题描述的完整性和用词的合理性均高于未回答问题。这些特征进一步的帮助我
们成功预测某个问题是否能在特定时间内收到答案,我们的预测模型在以1天、3天、7天和30
天为划分时间点时分别取得了70.22%、71.59%、76.84%和80.33%的准确率,值得注意的是,
从问题内容中识别出来的主题特征和语言学特征对于提升预测模型的性能提供了非常重要的贡
献。
关键词:经验软件工程,软件开发方法,挖掘软件库,stackexchange,定性分析
II
您可能关注的文档
最近下载
- AQ 6111—2023个体防护装备安全管理规范知识培训.pptx VIP
- 《GB_T 19494.1-2023煤炭机械化采样 第1部分:采样方法》必威体育精装版解读.pptx VIP
- 人因工程学郭伏教学.pptx VIP
- 可打印自然辩证法精简版.pdf VIP
- 人体工程学教材.pdf VIP
- 中心医院“十五五”发展规划(2026 - 2030年).docx VIP
- 2026龙飞平面图形推理基础理论➕百大图形3.0版本.pdf VIP
- 城乡生态与环境规划(李景奇)10 第十章 城市生态系统与景观生态规划.ppt VIP
- 2025广东深圳市龙岗区投控集团粮食公司招聘笔试备考试题及答案解析.docx VIP
- 文物建筑勘查设计取费标准(2020版)(试行).pdf VIP
文档评论(0)