大模型考问智能本质的哲学叙事--从DeepSeek效应的技术叙事谈起.pdfVIP

大模型考问智能本质的哲学叙事--从DeepSeek效应的技术叙事谈起.pdf

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

西北工业大学学报(社会科学版)2025年第2期

大模型考问智能本质的哲学叙事

从DeepSeek效应的技术叙事谈起

涂良川高镁琪

摘要:DeepSeek在人工智能训练与开发中以稀疏注意力替代了全局注意力机制,发挥了

蒸馏技术的效能并对强化学习算法进行了优化,不仅解决了大模型开发与训练中的强算力依赖

与高成本病的问题,而且将开源的效能提升到了新高度,推进了人工智能技术的发展。从总

体上讲,DeepSeek创新的技术逻辑,不仅使人工智能技术范式实现从“规模扩张”向“密度跃

迁”的跃升,而且使人工智能系统在推理中表现出智能的灵活性和功能的迁移性。DeepSeek作

为创新性的人工智能技术路径,不仅在功能上改进了混合专家模型架构,提升了智能的密度,

而且以技术叙事的方式追问了蒸馏机制与强化学习算法对于认知框架重塑和智能演化的可能、

意义与价值。因此,从技术机理出发探寻人工智能时代大模型DeepSeek对智能衍生逻辑的变

革,既要从社会历史活动出发真实应对人工智能时代智能存在与表达的面相,又要在技术逻辑

的创新与变革中追问其表达的人类性意义。

关键词:DeepSeek;大模型;智能本质;哲学叙事

中图分类号:B15;TP18文献标志码:A文章编号:1009-2447(2025)02-0050-09

DeepSeek通过架构创新与算法优化等技术其次,DeepSeek的成本压缩方式与开源模式正在

突破,正在以有别于GPT-3等传统大模型的方式影响人工智能行业风向,并促进了人工智能时代人

重塑人工智能研发范式,不仅为生成式人工智能类生活环境与生存方式的变革。DeepSeek作为技

提供了一条相对低成本、高成效的可持续发展路术革新的产物,通过大幅度降低计算量、减除低权

径,而且以技术的演进推动了人类对智能本质的重连接,同时利用蒸馏技术进行模型压缩,提升了

认知。首先,大模型DeepSeek以混合专家模型数据利用效率,优化了硬件使用效果,验证了算力

(MixtureofExperts,以下简称MoE)、蒸馏技术堆叠并非智能演化的必然路径,从而为通用人工智

(Distillation)与大规模强化学习(Reinforcement能(ArtificialGeneralIntelligence)提供了另一种发

Learning,以下简称RL)等手段优化了大模型的算展逻辑。最后,DeepSeek作为人类一般智力对象

法,打破了强算力等同于高智能的认知观念,使大化的产物,以生成合乎人类逻辑、符合人类期待的

模型由“大数据大任务”与“大数据小任务”的技回答满足了人类对智能的部分判定标准,这不仅缘

术范式向“小数据大任务”的经验学习范式演进。于合成数据的语义空间本质是人类文明史的数据化

基金项目:第七批“广东特支计划”宣传思想文化领军人才项目;国家社会科学基金一般项目“马克思主义哲学视域中的人

工智能奇点论研究”(21BZX002)

作者简介:涂良川,男,重庆云阳人,华南师范大学马克思主义学院教授、博士生导师,研究方向为人工智能哲学、马克思

主义哲学基础理论和政治哲学;高镁琪,女,吉林农安人,华南师范大学马克思主义学院博士生,研究方向为人

工智能哲学。

50

涂良川高镁琪:大模型考问智能本质的哲学叙事

投影,更是因为人类在对人造智能的剖析中映射了算这一判断的否定,而且是人工智能时代人类以

对自身智能本质的认知。在此意义上讲,“人工智“一般社会知识”[2]通向智能本质的途径。大模

能的出现本身也将改变人类对现实的定义,从而型DeepSeek并非完全沿袭传统大模型的智能架

改变人类对自身的界定”[。大模型DeepSeek的成构,而是利用混合专家模型选择性激活专家模块

功,不仅是对人脑神经科学中“稀疏编码”理论的协同运作。相比GPT-1等传统模型“大模型、大

技术肯认,并且在知识的动态构建中达成了对经验算力、大数据的技术路线”[3],“DeepSeek-V3

数据的超越与对先验框架的重组,更在人工造物的通过优化的算法、框架和硬件的协同设计来实现

文档评论(0)

新能源知识科普(本账号发布文档均来源于互联网公开资料,仅用于技术分享交流,相关版权为原作者所有。如果侵犯了您的相关权利,请提出指正,我们将立即删除相关资料)。

1亿VIP精品文档

相关文档