MCPLive > 杂志文章 > 透过天河一号看超级计算机技术

透过天河一号看超级计算机技术

2010-02-13河南大学 韩歌民《微型计算机》2010年1月下

机群的软件系统

超级计算机除了具备非常强大的计算能力,对操作系统以及软件的要求也比较高。

●节点机操作系统

操作系统为机群提供支持环境,决定了节点机之间的交互方式,应具备较强的适应性和稳定性,机群采用的操作系统主要有Linux、Sun Solaris UNIX和Windows NT等。其中,Linux因具有支持多种硬件平台、对系统资源的低占用率、开放代码、高安全性、稳定性和可靠性等诸多优点,特别是Linux提供了大量节点并行计算系统所需的标准消息传递机制(如后面介绍的MPI等)和高性能网络支持,使其在越来越多的机群系统中被广为采用。

●SSI和HA等中间件

机群系统是由大量节点计算机组成的并行处理系统,但从机群用户和程序员的角度而言,好能使结构复杂的机群像一台计算机一样便于使用和管理,具有单机式的管理控制、单一的地址空间和单一的文件系统等特性,以有效降低用户操作和程序员编程的复杂度,即具有“单一系统映像”(Single System Image,SSI)特性。

SSI由相应的机群中间件实现,所谓的机群中间件(Middleware)是指在上层连接各个节点机的操作系统、实现对机群系统资源和网络通信等进行有效控制和管理的软件系统或服务程序, 并且能提供便于用户管理和配置系统的图形化操作界面的接口。除了SSI之外,机群一般还有“高可用性”(High Availability,HA)管理等中间件,HA用来快速检测和排除机群系统的故障点,以确保系统能可靠地连续运行。

●并行编程环境

适用于机群、MPP等分布式内存结构的并行编程环境,通常可由“并行虚拟机”(Parallel Virtual Machine,PVM)或“消息传递接口”(Message Passing Interface,MPI)等来实现。利用PVM工具,可以把互连的各种计算机虚拟为一台并行机,从而为编程人员提供了一个便于管理和使用的编程环境,而由PVM的编译库对程序进行转换,将程序的计算任务分解为若干子任务后合理分配到各个节点机进行并行处理。MPI是一种基于消息传递的并行计算规范,消息(Message)一般包括数据、指令或其它各种控制信号等,MPI提供了一套消息传递库,基于消息传递的并行编程实际上就是通过调用MPI的消息传递库函数实现节点机之间的数据交换,并提供并行处理任务之间的同步等。目前,基于PVM和MPI并行编程环境,都可以支持C、C++和FORTRAN等的并行编程。

分享到:

用户评论

共有评论(2)

  • 2010.03.22 11:10
    2楼

    通过互联网把计算机连接起来这个方法不错,在国外可以,在中国行不通,就中国这样的网络环境,就这么点带宽,再等个十年再说吧。

    (0) (0) 回复
  • 2010.02.13 02:52
    1楼

    高速互联网是个好的中介,未来可以把好多高性能的计算机作为节点,也是云计算的一种

    (0) (0) 回复

用户名:

密码: