利用低成本的普通微机组建的机群系统在很多实验室、高校和研究机构都发挥了作用,例如非常著名的贝奥武夫(Beowulf)机群(1994年由美国洛斯阿拉莫斯国家实验室搭建)。只要有一定数量的微机和适当的网络设备,人们都可以组建自己的机群系统或“超级计算机”,去完成一些任务量较大的数值处理或科学计算等方面的工作。
●硬件环境和组网
用来组建机群的微机配置和数量可根据具体情况选择,节点机的互连可采用易于实现的100M以太网。例如,为了降低成本可使用10台被闲置的计算机作为节点机,将各个节点机与100M以太网交换机连接组网并确认网络通信正常。
●软件配置和安装
节点机操作系统一般采用Linux,例如Red Hat Linux。机群软件系统的安装和配置可使用OSCAR、xCAT、Rocks、Clusterworx、SystemImager或Warewulf等集成化的Linux机群构建和管理工具包来完成。例如,基于Linux环境的OSCAR(Open Source Cluster Application Resources)就是集成有机群系统安装和设置、管理和并行编程环境等完整工具的软件包,且采用图形化安装向导,能一步步提示用户轻松地完成机群系统的安装配置和管理维护。
基于OSCAR的机群节点机中一台作为系统服务器(OSCAR Server),其余节点机都是用于并行计算的客户机(OSCAR Client)。安装基本步骤为:在选择作为OSCAR服务器的那台节点机上安装Red Hat Linux、配置和启动X-Window,然后安装和运行OSCAR,按照OSCAR安装界面上的提示依次进行“安装服务器”(Install OSCAR Server Packages)、“创建客户机映像”(Build OSCAR Client Image)、“定义和安装客户机”(Define OSCAR Clients)、“设置网络”(Setup Networking)和“完成机群设置”(Complete Cluster Setup)等步骤即可完成机群的安装和设置,之后可用“测试机群设置”(Test Cluster Setup)对安装好的机群进行测试。