Altair nanoFluidX™

基于粒子的流体动力学仿真

功能

nanoFluidX 代码基于粒子的特性有助于获得简洁而高效的流体方案,流体在仿真过程中会发生严重变形,如晃动、激烈的多相流体运动或穿过复杂几何形状的快速运动。

 

一般自由液面流体

对动力总成系统中的燃油、开放环境中自由流动的流体、高加速度下开放或封闭储罐中的流体及类似条件下的流体的晃动情况进行仿真。

 

高密度比多相流体

nanoFluidX 中的光滑粒子流体动力学 (SPH) 方法可轻松处理高密度比多相流体(如水和空气两相流体),而无需额外的计算作业。流体接口是 SPH 方法本身所具有的功能,因此无需额外重建接口,可节省计算时间。

 

旋转齿轮、曲轴和连杆

nanoFluidX 采用了对不同类型运动的多个选项,因此对回转齿轮、曲轴和连杆的仿真变得更加容易,当实体单元与周围的流体相互作用时,可测量实体单元所承受的力和力矩。

 

油箱晃动

测量速度发生急剧变化时(如刹车或突然变道)油箱或汽车所受的作用力。

 

GPU 计算

与效率低下的 CPU 相比,GPU 计算具有明显的性能优势和节能效果。科学和工程计算领域的 GPU 技术变革正在快速推进,nanoFluidX 正是使用这项技术的开拓性商业软件包之一,可显著加快整个产品开发流程。

 

作为比较,我们使用 nanoFluidX 和基于商业 CPU 的 SPH 代码对拥有 1350 万个粒子,参考 PRM 为 3000,物理时间为 3.4 秒的复杂双离合器传输 (DCT) 进行了仿真。CPU 代码采用一个 32 核系统,而 nanoFluidX 运行在 4 个 NVIDIA Tesla V100 显卡上运行。nanoFluidX 在 48 小时内完成了仿真,而 CPU 代码花费了 255 个小时。前者速度快了 530%,而耗能要少 865%(参见图库)。

 

标准有限体积 CFD 代码甚至很可能无法对如此复杂的几何体的仿真进行初始化,即使成功初始化,其预处理时间也需要数周,并且这种仿真的计算成本会非常高。

32 核 CPU 系统 (Intel Xeon E5-2665) 与运行于 4 个 NVIIDIA Tesla V100 GPU 显卡之上的 nanoFluidX。
* 能耗假设:仅处理器,无外围设备;8 核 CPU 95W;Tesla V100 250 W

 

简化预处理

无需典型网格,导入几何结构、选择单元并生成粒子即可。无需花费额外的时间进行前处理并设计出足够好的网格。

 

刚体运动

除了旋转运动,nanoFluidX 代码可借助输入文件指定单元轨迹。研究任意平移的实体与周围流体的相互作用。

 *所引用的数据取决于具体案例和配置。 

 

硬件要求

nanoFluidX 团队推荐使用 NVIDIA Tesla V100、P100 和 K80 加速器,因为它们属于成熟的 GPU 显卡,可用于数据中心的科学计算,且 nanoFluidX 已针对以上型号进行了全面的测试。Nvidia Tesla M 系列 (M40, M60) 也可运行 nanoFluidX,但是这些显卡仅能提供不错的单精度性能,基本无法运行双精度运算。

 

其他一些 NVIDIA GPU 型号(Quadro 系列、GeForce 系列等)提供的计算性能理论上可以满足 nanoFluidX 的要求。但是,开发团队不能确保 nanoFluidX 在这些显卡上运行时的准确度、稳定性和整体性能。请注意,目前的 NVIDIA EULA 协议禁止以商业形式在 4 核及以上的 GPU 中捆绑使用非 Tesla 系列的显卡作为计算资源。

 

该代码还具有动态负载平衡功能,可确保最佳硬件利用率,并且还可以在多节点群集上运行。

 

推荐的硬件配置

  • 64GB 或更大容量的 RAM

  • # CPU 内核数量应等于 # GPU 设备数量 – 在 GPU 设备之间传递的消息由 CPU 处理。理想情况下, CPU 内核的数量将略高于可用 GPU 设备的数量,以确保拥有足够的计算性能以生成结果输出等。

  • 2TB 或更大的 HDD 硬盘空间

  • 用于多节点系统的 Infiniband 或 OmniPath 连接

支持的平台

  • 搭载 4.4.7 以上版本的 GCC 和 GLIBC 2.12 的所有基于 Unix 的操作系统(RHEL 6.x 和 7.x 以及兼容的 Scientific Linux、CentOS、Ubuntu 14.04 和16.04、OpenSUSE 13.2 等)

  • NVIDIA CUDA 8.0 和 OpenMPI 1.10.2– 由二进制文件提供。

快速知晓

订阅信息速递了解产品培训、新闻、活动等信息