- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SSE体系结构和编程
SSE编程;什么是SIMD;Intel的SSE技术;Intel的SSE技术;SSE2的寄存器结构;SSE1、2的数据类型;SSE指令;浮点指令;整数指令;使用SSE指令的四种方法;四种方式的比较;VC8.0的内嵌原语(intrinsics);内嵌原语的数据类型;内嵌原语的类别;矩阵变换 例:_MM_TRANSPOSE4_PS(row0, row1, row2, row3) 作用:转置一个4×4的单精度或双精度元素矩阵;混洗操作 例:_MM_SHUFFLE(z, y, x, w) (z6) | (y4) | (x2) | w 说明: 从第一个操作数中选取两个数,从第二个操作数中选取两个数,形成一个结果字 ;支持Cache控制 _mm_prefetch:预取稍后运行需要的数据 _mm_stream_pi:把指定位置的数据存储到指定的地址,而不替换cache 整型原语 _mm_extract_pi16: 从4个字中提取一个字 _mm_insert_pi16: 插入一个字 _mm_max_pi16: 计算出最大值 _mm_min_pi16: 计算最小值 读写控制寄存器 _MM_SET_EXCEPTION_STATE:设置异常状态寄存器 _MM_GET_EXCEPTION_STATE:读取异常状态寄存器 可以操作寄存器还包括:EXCEPTION_MASK(异常屏蔽寄存器)、ROUNDING_MODE(舍入模式寄存器)、FLUSH_ZERO_MODE(清0模式寄存器);存储操作 _mm_store_ss: 存储低位值 _mm_store_ps: 存储4个值,位址对齐 _mm_storer_ps: 存储4个值,顺序相反 读取运算 _mm_load_ss: 读取低值,同时清空其他3个高值 _mm_loadr_ps: 以相反的顺序读入4个值 设置运算 _mm_set_ss: 设置低位为1,同时清空其余三个高位值 _mm_set1_ps: 设置所有4个值为同一值 _mm_setzero_ps: 把所有4个值清零;转换运算 _mm_cvtss_si32:转换单精度浮点数为32位整数 _mm_cvttss_si32:转换单精度浮点数为32位整数(带截断操作) _mm_cvtpi16_ps :转换16位有符号整数为单精度浮点数 比较原语 _mm_cmpeq_ss:是否相等 _mm_cmplt_ps:是否小于 _mm_cmpgt_ps:是否大于 逻辑运算 _mm_and_ps:与运算 _mm_or_ps:或运算 算术运算 _mm_add_ss:加法 _mm_sub_ps:减法 _mm_mul_ps:乘法;SSE程序实例;SSE程序实例;数组-结构(AoS );结构-数组(SoA);SSE程序实例; // 计算y’(i)和y’(i+1) mx0 = _mm_mul_pd(tx, WM-dm10); //tx, ty, tz已经事先读入 mx1 = _mm_mul_pd(ty, WM-dm11); mx2 = _mm_mul_pd(tz, WM-dm12); mx0 = _mm_add_pd(mx0, _mm_add_pd(mx1, _mm_add_pd(mx2, WM-dm13))); _mm_store_pd(vertex.y + i, mx0); // 计算z’(i)和z’(i+1) mx0 = _mm_mul_pd(tx, WM-dm20); mx1 = _mm_mul_pd(ty, WM-dm21); mx2 = _mm_mul_pd(tz, WM-dm22); mx0 = _mm_add_pd(mx0, _mm_add_pd(mx1, _mm_add_pd(mx2, WM-dm23))); _mm_store_pd(vertex.z + i, mx0); //计算z’(i)和z’(i+1) mx0 = _mm_mul_pd(tx, WM-dm30); mx1 = _mm_mul_pd(ty, WM-dm31); mx2 = _mm_mul_pd(tz, WM-dm32); mx0 = _mm_add_pd(mx0, _mm_add_pd(mx1, _mm_add_pd(mx2, WM-dm33))); _mm_store_pd(vertex.w + i, mx0); };SSE程序实例
您可能关注的文档
最近下载
- 2025年必威体育精装版劳动合同法全文.docx VIP
- 养老服务机构服务质量星级评定检查细则一.doc VIP
- 中国心血管健康与疾病报告.pdf VIP
- 《中国天然气发展报告(2016)》.docx VIP
- (高清版)B-T 24353-2022 风险管理 指南.pdf VIP
- GB∕T 24353-2022 《风险管理 指南》解读和应用指导材料(雷泽佳编写2024B0).pdf VIP
- 2025年版检验检测机构资质认定评审准则考试试题及答案.pdf VIP
- 前交通动脉瘤破裂伴蛛网膜下腔出血个案护理.pptx VIP
- 临床颅内动脉瘤破裂伴蛛网膜下腔出血的个案护理.pptx VIP
- 检验检测机构资质认定评审准则试题及答案.pdf VIP
文档评论(0)