高效能计算机系统虚拟化技术研究

时间:2024-11-10 12:42:11 来源:作文网 作者:管理员

当前,在服务整合、安全管理等方面已经实现了虚拟化技术的广泛应用。高性能计算技术向着高产出率的方向不断发展,传统的高效能计算机共享服务模式已经不能够满足其发展的需求了,同时还会给共享使用环境造成一定的安全隐患。当前,虚拟化技术由于性能等方面的原因在高效能计算机中的应用并不广泛,本文针对这种现象提出了针对高效能计算机的虚拟化技术,实现系统安全性、可靠性与易用性的增强。

一、高性能虚拟域技术的设计目标

高性能虚拟域技术(High Performance Virtual Zone ,HPVZ)的设计目标包括两个方面:第一,对高效性计算系统的计算性能实现尽可能的保持;第二,实现了系统管理最大限度的简化,同时增强其安全性、可靠性与易用性。

(一)高效性

高性能并行计算机在进行设计的过程中,其核心的目标就是要实现计算服务的高性能。虚拟化技术具有开销较低的特点,通过操作系统层中虚拟化技术的应用,实现用户在编程、编译及任务提交、计算等环节中性能损失的降低。

(二)易用性

传统的高性能并行计算机为用户提供的共享使用环境是一致的,在这种情况之下,在对共享使用环境进行管理与使用的过程中就会变得较为复杂。通过虚拟化技术的应用,能够实现计算环境的灵活构建,满足不同用户的需求,实现属于用户自身的高性能计算系统。

(三)安全性

在传统高性能并行计算机系统进行设计的过程中,往往会忽略安全问题,对系Ⓐ统的性能造成较大的损失。在高性能计算机中,其安全的核心就是确保数据的安全。系统内部出现的攻击、误用等情况是用户ฅ数据安全威胁的主要来源,因此计算机在确保其性能的基础上应该实现用户之间的安全隔离,通过这种方式实现安全性的提高。

二、高性能虚拟域技术的体系结构

高性能虚拟域技术的系统中包括服务结点虚拟计算域、计算结点高性能计算域、面向虚拟域的作业管理系统三个方面。

服务结点的虚拟计算域主要的作用是为用户提供独立登陆环境,而且这种独立登陆环境是可以定制的,用户在对虚拟计算域进行配置的过程中可以将自身的需求作为依据,使用编程、编译、调试、提交等功能。面向虚拟域的作业管理系统主要的作用是实现系统资源的管理,在对计算资源进行管理的过程中,要将据用户提交任务的规模与服务质量需求作为依据。此外,面向虚拟域的作业管理系统的作用还包括构建高性能计算域的动态构建。计算结点的高性能计算域的文件目录视图与服务结点的虚拟计算域相同,同时还增加了服务质量保证、文件隔离等功能,为高性能的计算服务提供支持。

三、面向高性能计算的高性能虚拟域技术

(一)服务结点虚拟计算域

服务结点的虚拟计算域是以操作系统级虚拟化技术为基础形成的。操作系统级虚拟化技术能够在操作系统中实现多个用户运行环境的构建☣,而且这些用户运行环境之间是相互独立的,从而实现了多个独立的用户运行环境在同一个操作系统内核中运行。系统性能的损失较小是操作系统级虚拟化技术的特点。高性能虚拟域技术采用双分区单影像优化技术,这种方式具有两方面的优点,一方面能够满足服务阵列的单系统映像需求,另一方面能够进一步实现性能损失的降低。

(二)计算结点高性能计算域

用户在高性能 ت并行计算机中进行作业提交的过程中,这些作业将会被提交到服务结点中,之后在计算结点中对这些作业进行处理。计算结点的功能只包括用户任务计算,不包括登陆服务。因此,大部分的高性能并行计算机为了能够降低软件开销,在计算结点操作系统中采用精简内核。因此,如果在计算结点中实现完整的Open VZ环境的构造,将会造成系统性能的损失。依据计算结点的使用方式,高性能虚拟域技术实现了基于文件路径转换的高性能计算域构成技术的应用。高性能虚拟域技术通过CHROOT的方式实现了用户作业的转换,依据用户作业的VZ根路径信息将其切换到对应的VZ环境中,实现了服务结点与计算结点文件视图的一致性。

(三)面向虚拟域的作业管理

在服务结点虚拟计算域与计算结点高性能域之间,作业管理主要的作用就是实现两者之间的连接。高性能虚拟域技术的作业管理系统是以Slurm为基础进行构造的,在用户加载作业的过程中,作用管理系统依据用户的任务规模对计算资源进行分配,之后提取虚拟计算的运行路径,将虚拟计算运行路径作为环境变量,与作业一起加载到计算结点。高性能虚拟域技术在批处理作业加载的过程中,采用了修改路径名与路径切换相结合的✫方式,从而确保系统运行的准确性。

总结:

高性能虚拟域技术是针对高性能并行计算机所具有的特点而提出的虚拟化方案。以系统计算性能保持为前提条件,通过高性能虚拟域技术实现了传统高性能并行计算机共享使用模式向着独立使用模式的转变,为用户的使用提供了更多的便捷。未来针对高可靠计算需求进行研究的过程中,还需要对虚拟化网络通信设备的进程动态迁移计算进行研究,确保计算结点在出现故障之前实现用户任务的迁移,从而实现系统可靠性的进一步增强。


热门排行: 教你如何写建议书