隨著AI大模型快速發(fā)展和規(guī);瘧(yīng)用,傳統(tǒng)的通算云服務(wù)已難以滿足智能化應(yīng)用和新興場(chǎng)景創(chuàng)新發(fā)展需求,算力云服務(wù)加速向智算云服務(wù)演進(jìn);鑒于多樣化應(yīng)用場(chǎng)景對(duì)智算精度、智算時(shí)延要求存在差異,為實(shí)現(xiàn)智算資源最大化利用,混合使用高精度和低精度算力將成為新趨勢(shì),在此背景下,AI IaaS更加強(qiáng)調(diào)兼容適配多元異構(gòu)智能算力。
智算云服務(wù),即智能算力云服務(wù),旨在將AI算力以云服務(wù)的方式提供給用戶。作為國(guó)內(nèi)領(lǐng)先的云計(jì)算服務(wù)商,優(yōu)刻得近年來(lái)緊抓人工智能時(shí)代的發(fā)展契機(jī),依托其在云服務(wù)領(lǐng)域的深厚積累與豐富的工程化實(shí)踐經(jīng)驗(yàn),不斷深耕大模型領(lǐng)域。以自建的內(nèi)蒙古烏蘭察布和上海青浦兩大智算中心為承載,優(yōu)刻得正加速構(gòu)建智算集群,并推出了全棧式AIGC智算解決方案,助力行業(yè)客戶快速實(shí)現(xiàn)AIGC應(yīng)用的落地與云上創(chuàng)新增長(zhǎng)。
在智算基礎(chǔ)設(shè)施層面,優(yōu)刻得通過(guò)“算力合伙人”的生態(tài)模式,不斷匯聚自建算力、客戶托管算力及社會(huì)閑散算力,成功打造了融合算力平臺(tái),助力客戶便捷地獲取算力資源,還以“云平臺(tái)”的形式對(duì)異構(gòu)GPU算力集群進(jìn)行高效管理和運(yùn)營(yíng)。目前,優(yōu)刻得自有算力規(guī)模超4700P,并在技術(shù)創(chuàng)新和項(xiàng)目落地中不斷取得突破。優(yōu)刻得智算云已成功服務(wù)于智譜AI、昆侖萬(wàn)維、出門問(wèn)問(wèn)等眾多企業(yè)與機(jī)構(gòu)。
優(yōu)刻得將技術(shù)創(chuàng)新與實(shí)際應(yīng)用緊密結(jié)合,不僅提供裸金屬、容器、虛擬機(jī)計(jì)算、專屬計(jì)算區(qū)等基礎(chǔ)設(shè)施服務(wù),還涵蓋了從訓(xùn)練流程優(yōu)化、智算集群調(diào)度、高性能網(wǎng)絡(luò)與存儲(chǔ)等一系列技術(shù)服務(wù)。基于自主研發(fā)的“孔明”智算平臺(tái)、高性能并行文件存儲(chǔ)平臺(tái)UPFS和大規(guī)模推理平臺(tái),優(yōu)刻得智算云可全方位滿足智能算力供應(yīng)、底層異構(gòu)算力資源調(diào)度、模型應(yīng)用層面的工程化平臺(tái)構(gòu)建、模型微調(diào)與定制化行業(yè)模型、推理應(yīng)用快速部署等各類需求。
其中,孔明智算平臺(tái)支持對(duì)異構(gòu)算力調(diào)度、實(shí)時(shí)監(jiān)測(cè)集群狀態(tài),實(shí)現(xiàn)斷點(diǎn)續(xù)算和訓(xùn)練集群的智能調(diào)度和管理;UPFS并行文件存儲(chǔ)則通過(guò)GDS技術(shù)提高讀寫吞吐能力,實(shí)現(xiàn)Checkpoint的快速讀寫;在網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)上,優(yōu)刻得支持IB和RDMA 高速網(wǎng)絡(luò),降低大模型研發(fā)過(guò)程中的網(wǎng)絡(luò)延時(shí)。通過(guò)GPU虛擬化、集群智能調(diào)度、存儲(chǔ)管理等技術(shù)創(chuàng)新,有效提高大模型的有效訓(xùn)練時(shí)長(zhǎng)、千卡并行計(jì)算效率,從而大幅提升智算資源的利用效率。
目前,優(yōu)刻得正積極參與算力互聯(lián)調(diào)度平臺(tái)的聯(lián)合共建工作,并已成功接入上海算力交易平臺(tái)、長(zhǎng)三角(上海)算力互聯(lián)互通平臺(tái)、北京算力互聯(lián)互通和運(yùn)行服務(wù)平臺(tái)等。以“智算云”的服務(wù)模式,優(yōu)刻得為人工智能大模型企業(yè)精準(zhǔn)匹配了合適的算力資源,滿足了多元化的算力與應(yīng)用部署需求。
報(bào)告最后指出,智算云服務(wù)已成為推動(dòng)AI技術(shù)創(chuàng)新和產(chǎn)業(yè)發(fā)展的重要基礎(chǔ),亟需構(gòu)建面向未來(lái)發(fā)展的生態(tài)體系。圍繞產(chǎn)業(yè)AI化與AI產(chǎn)業(yè)化的雙重需求,要不斷推進(jìn)智算服務(wù)與具體業(yè)務(wù)、場(chǎng)景的深度融合,充分釋放智算服務(wù)的價(jià)值,打造智算云服務(wù)應(yīng)用示范項(xiàng)目。
作為智算云服務(wù)先鋒企業(yè),優(yōu)刻得將持續(xù)提升技術(shù)創(chuàng)新能力,使得智算云服務(wù)更加安全、普惠、易用,不斷推動(dòng)智算云服務(wù)產(chǎn)業(yè)生態(tài)健康發(fā)展,為數(shù)字經(jīng)濟(jì)的繁榮提供強(qiáng)大的算力支撐和技術(shù)賦能。