并行时域有限差分方法的VALU加速技术

出版时间:2012-11  出版社:余文华、李文兴、 张泳 哈尔滨工业大学出版社 (2012-11出版)  作者:余文华,李文兴,张泳 著  页数:202  

内容概要

  《“十二五”国家重点图书·电子与信息工程系列:并行时域有限差分方法的VALU加速技术》是关于使用计算机处理器中的矢量运算单元(Vector Arithmetic Logic Unit,UALU)加速并行时域有限差分方法的著作,介绍了如何使用SSE指令集通过VALU加速并行的时域有限差分方法,并通过对一个具有矢量运算单元加速的三维高性能并行时域有限差分程序的详细分析,说明了具体应用方法和技术,这个程序的高性能已经在许多实际应用中对于不同的硬件平台得到过验证。与GPU、IBMCell处理器和FPGA加速技术相比,矢量运算单元加速更加有效并且不需要增加任何额外的硬件设备。  《“十二五”国家重点图书·电子与信息工程系列:并行时域有限差分方法的VALU加速技术》对于当前最热门的研究方向之一的云计算,也介绍了一些基本概念以及在工程计算中的应用。  《“十二五”国家重点图书·电子与信息工程系列:并行时域有限差分方法的VALU加速技术》适合用于电磁场与微波技术专业及其他工程计算专业的高年级本科生与研究生的参考书,也可以用作电磁场与微波技术专业及其他工程计算专业老师、研究人员和电气工程师的参考书。

作者简介

余文华,为宾夕法尼亚州立大学电磁通讯实验室访问教授,哈尔滨工程大学特聘教授,博士生导师。发表论文150多篇,出版专著7部,开发了世界上第一个商业并行电磁仿真软件,创造并保持着商业电磁仿真软件4000个计算机90%并行效率的世界纪录。目前为IEEE高级会员、和中国电波科学学报外籍等编委。 李文兴,为哈尔滨工程大学舰船电磁兼容学科和电磁场与微波技术学科带头人,先后主持和参加20余项军用和民用项目,获部级科技进步二等奖1项、部级三等奖3项和黑龙江省第二届青年科技奖,省级精品课2项,主持开发的产品被确定为国家重点新产品5项、国家重点火炬计划2项,发表论文30余篇,现为中国电子学会高级会员,IEEE学会会员。

书籍目录

第1章时域有限差分方法 1.1时域有限差分方法 1.1.1时域有限差分递推方程 1.1.2时域有限差分稳定性分析 1.1.3吸收边界条件 1.2并行FDTD方法 参考文献 第2章VALU加速技术 2.1SSE指令集 2.2c和c++中的SSE应用 2.3SSE编程实例 2.3.1SSE类型 2.3.2编程实例 2.4VALU在FDTD方法中的应用 2.4.1磁场Hx的计算方法 2.4.2磁场Hy的计算方法 2.4.3磁场Hz的计算方法 2.4.4电场Ex的计算方法 2.4.5电场Ey的计算方法 2.4.6电场Ez的计算方法 2.5VALU性能分析 2.5.1空盒子标准测试 2.5.2电偶极子天线 2.5.3贴片天线 参考文献 第3章PML加速技术 3.1PML区域中场的递推方程 3.2SSE加速技术在PML递推中的应用 参考文献 第4章并行处理技术 4.1单指令单数据 4.2单指令多数据指令集 4.3OpenMP 4.4MPI 4.5三级并行架构 参考文献 第5章工程应用实例 5.1硬件平台描述 5.2实际问题的性能考察 5.3表面电流分布计算技术 5.4螺旋天线阵列 5.5平板介质透镜 5.6汽车电磁分析 5.7飞机电磁分析 5.8有限大小频率选择结构分析 5.9弯曲频率选择结构分析 5.10微带低通滤波器分析 5.11微波混响室 5.12波音737WIFI分析 5.13波导缝隙天线阵 参考文献 第6章云计算技术 6.1云计算中的基本技术术语 6.2电磁云计算举例 6.2.1电磁云计算实例 6.2.2Rocks集群管理软件 6.3科学云计算 6.3.1引论 6.3.2云计算服务 6.3.3科学云计算的特点 6.3.4云计算中先进技术 6.4云计算和网格计算 参考文献 附录三维并行FDTD源代码 附录1输入参数 附录2输出参数 附录3程序功能 附录4程序要求 附录5子程序列表 附录6源代码 参考文献 索引

章节摘录

版权页:   插图:   当今各类高性能计算机工作站和服务器的主流处理器(CPU)都是由AMD或者Intel提供的。无论是工程仿真计算程序的开发者还是应用者,都十分关心如何提高计算机工作站和服务器的性能。很难准确比较AMD处理器和Intel处理器的性能,因为我们没有办法在一个给定平台上得到一个绝对的比较指标。无论是AMD处理器还是Intel处理器,通常我们关心如下可能影响到电磁仿真性能的重要指标。 ①主频:它是影响电磁仿真性能的一个重要指标,计算机主频与仿真速度成正比。就仿真性能来说,主频越高电磁仿真的速度就越快。 ②核数:它是一个重要指标并决定VALU的数量。一般来说,核数越多,VALU的数量越多,电磁仿真的速度就越快。 ③制造工艺:制造工艺越高、功耗越小,性能越好。例如,对于32 nm工艺和45 nm工艺的处理器,如果其他指标相同,32 nm工艺处理器的性能要好得多。 ④L1缓存:它的数量直接影响电磁仿真的速度。缓存的数量越大电磁仿真速度就越快。每个核都有自己的L1缓存。 ⑤L2缓存:L2缓存比L1缓存慢,它的数量也影响电磁仿真的速度。缓存的数量越大电磁仿真速度就越快。现在的L2缓存都是所有的核共享的。 ⑥Hyper Transport(AMD)/Quick Path Interconnect(Intel):是为了提高多处理器工作站内存带宽特性而设计的,它要求程序是并行的,可以把每一个处理器要求的数据存放在自己的本地内存。 ⑦内存:它的速度和带宽直接影响电磁仿真的速度。内存的速度越快、带宽越宽,电磁仿真的速度就越快。 ⑧SMP兼容性:决定可以安装多少个处理器在一个主板上。 ⑨平均CPU功耗(AMD)/热设计功耗(Intel):消耗在处理器上的能量。 对于一个程序开发者或者使用者,熟悉计算机的内部结构和程序执行过程是十分重要的。当一个FDTD程序开始运行时,FDTD程序首先在内存中为每一个变量和数组分配所需的内存,然后开始按程序顺序执行程序,或者按编译器优化过的顺序执行代码。FDTD的数据主要存放在内存中,然而,为了提高速度,最近所需要的数据则要存放在L1和L2缓存中。

编辑推荐

《并行时域有限差分方法的VALU加速技术》对于当前最热门的研究方向之一的云计算,也介绍了一些基本概念以及在工程计算中的应用。《并行时域有限差分方法的VALU加速技术》适合用于电磁场与微波技术专业及其他工程计算专业的高年级本科生与研究生的参考书,也可以用作电磁场与微波技术专业及其他工程计算专业老师、研究人员和电气工程师的参考书。

图书封面

评论、评分、阅读与下载


    并行时域有限差分方法的VALU加速技术 PDF格式下载


用户评论 (总计0条)

 
 

 

250万本中文图书简介、评论、评分,PDF格式免费下载。 第一图书网 手机版

京ICP备13047387号-7