中新網(wǎng)山西新聞7月9日電 (記者 胡健)近日,記者從國(guó)家先進(jìn)計(jì)算太原中心獲悉,為支持生物技術(shù)賦能經(jīng)濟(jì)社會(huì)發(fā)展,國(guó)家先進(jìn)計(jì)算太原中心幫助華大基因在先進(jìn)計(jì)算平臺(tái)上對(duì)第三代測(cè)序軟件進(jìn)行移植,構(gòu)建起高效的生物分析計(jì)算流程與存儲(chǔ)方案。
國(guó)家先進(jìn)計(jì)算太原中心(以下簡(jiǎn)稱“太原中心”)是由山西省委、省政府推動(dòng)建設(shè)的信息化基礎(chǔ)設(shè)施。太原中心依托“算力+算法+算據(jù)”綜合體系,成為推動(dòng)科技進(jìn)步與產(chǎn)業(yè)升級(jí)的重要引擎。
生物科學(xué)領(lǐng)域一直對(duì)存、算能力有著極高的要求。例如,人體全基因組測(cè)序每天生產(chǎn)的數(shù)據(jù)約為1TB-6TB,要分析這些數(shù)據(jù),不僅提交計(jì)算任務(wù)數(shù)量多,且單個(gè)核心計(jì)算任務(wù)時(shí)長(zhǎng)不定,這就要求計(jì)算資源必須具備足夠多的物理核心和存儲(chǔ)空間。
為此,太原中心提供了萬(wàn)余核心的動(dòng)態(tài)共享資源及10個(gè)以上獨(dú)占節(jié)點(diǎn);在存儲(chǔ)方面,提供了數(shù)百TB的分布式存儲(chǔ)和Gbps級(jí)專線。通過(guò)動(dòng)態(tài)節(jié)點(diǎn)與獨(dú)占節(jié)點(diǎn)混合方式,確保在處理大量小核心任務(wù)時(shí)仍能維持計(jì)算資源的最優(yōu)配置,最高支持并發(fā)作業(yè)可達(dá)5000個(gè)。
此外,太原中心通過(guò)智能管理平臺(tái)整合資源,搭建起統(tǒng)一且便捷的使用界面,并引入腳本、模板及圖形化提交等靈活的作業(yè)提交方式。不僅簡(jiǎn)化了用戶操作,也有效解決了軟件管理和使用的難題。(完)