大家好,我叫吴一冰,负责品高云在教育行业的相关工作。给大家分享一个品高云在教育行业众多方案当中非常有话题性的一个方案——HPC in Cloud,告诉大家我们的云计算是如何支撑高性能计算的。
首先来看看为什么我们需要做HPC(高性能计算)?
HPC现在用于很多科研,或者是用于需要由科研来支撑生产环境的一些具体的领域,需要大规模的计算能力来做仿真实验,进行一些数据处理。举个例子,比如说石油勘探,它需要根据我们现有的一些数据去算哪些地方有石油,有多少石油的储备,这个是需要有非常大规模的计算能力的。再例如天气预报、汽车设计及核爆实验等,都需要采集大量的数据分析,然后进行相关数据的整合、预测以及根据历史数据进行相关趋势的判断。
那在HPC具体在教育行业能做些什么呢?
对于学校来说,科研经费的申请方式是以项目为单位的,项目团队之间的申请到的科研经费、资源可能相差很大,出现资源分配不均的问题。那项目组之间能否相互借用资源呢?答案是,比较难。为什么难?因为课题组之间相对比较独立,我有我的科研课题组,你有你的科研课题组,我这个课题组的钱是得花在我们这里的,这是一个归属问题。第二点,即便我愿意借给你,我是不是真的能借给你?这就是第二个问题。
对于科研的高性能计算来说,不是用一个PC机就能把所有事情做完,它是有一个非常复杂的计算架构的。假如我是一个物理教授,我采购一套设备,只用了三个月,三个月后这些设备我就不常用了。如果我愿意借给你,当我借给你之后,你要把我的计算环境都铲掉,如果你是化学老师的话你还要搭一套模拟化学分子实验的环境,你可能还要花很长时间。然后你再把它还给我之后,我还要在重新搭回原来的环境。从技术层面和时间层面来说,科研资源之间的分享与借用所花费的成本都太高了。
以上问题简单来说,就是资源交付效率比较低,资源交付效率低说一个简单的解释就是:资源从没有到有的过程特别长。而云计算最好的特点,也就是它最本质的优势,就是提高了资源交付效率。我们的资源,有硬件、软件和各种各样的系统,可以通过自动化的云服务的形式来支撑上层的各类应用系统,比如说它有结构的应用,同时也会有专门为了科研环境所准备的高性能计算的应用。比如说Matlab,对学校IT管理者来说,他需要做的事情非常简单,他只需要分别配额给这些不同的科研团队的人员让他们自助使用就可以了,配额大家都知道,我可以分配你100个核,200G内存和500G存储,你在这个范围之内可以随便去使用它,并不需要由它来做各种各样复杂的安装配置部署,统统由云服务自助完成就可以了。
作为一个高性能计算的平台,它需要解决的问题很多,首先需要解决很多复杂的底层资源的环境。我们想让网络中心或者资源管理者只专注于做运营者而不是运维者,希望云来代替人来去解决这些复杂的问题。对用户来说,需要他们动手做的东西,越简单越好,越傻瓜越好。怎么才能让那些搞生命科学的人都可以使用高性能计算呢?他们并不精通IT技术,所以对于他们来说越简单越好。因此在这个过程中,云平台能够提供的服务就是,用户只需去选择计算规格、软件及集群规模,剩下的事情直接交给由云来去自动的装配所有的集群,去完成刚才的一系列复杂事情的自动化工作,能够很好地解决用户问题。
云计算通过提高资源的交付效率,使网络中心IT管理员从运维者变身为运营者,也使学校网络中心从成本中心向服务中心转变,这就是我们品高云平台所带来的价值。