為什么要開放高質(zhì)量網(wǎng)智數(shù)據(jù)集
通信網(wǎng)絡(luò)是數(shù)字經(jīng)濟(jì)發(fā)展的基石,提升通信網(wǎng)絡(luò)的智能化水平,建設(shè)高度數(shù)字化、智能化的自智網(wǎng)絡(luò)是不僅是當(dāng)前ICT產(chǎn)業(yè)技術(shù)創(chuàng)新的熱點(diǎn)方向,更關(guān)系到數(shù)字經(jīng)濟(jì)的發(fā)展新動(dòng)能。長期以來,通信行業(yè)缺少具備行業(yè)影響力、公信力的通信網(wǎng)絡(luò)公開數(shù)據(jù)集,尤其是有現(xiàn)網(wǎng)特色的真實(shí)、多樣的規(guī)模性數(shù)據(jù),制約著網(wǎng)絡(luò)智能化關(guān)鍵技術(shù)的發(fā)展與突破,業(yè)界對高質(zhì)量數(shù)據(jù)集需求迫切。
首批開放的數(shù)據(jù)集覆蓋多種場景
首批開放的7個(gè)網(wǎng)智精品數(shù)據(jù)集,來自于移動(dòng)現(xiàn)網(wǎng)不同領(lǐng)域的生產(chǎn)創(chuàng)新需求,經(jīng)過數(shù)據(jù)清洗及治理,總數(shù)據(jù)量達(dá)到上億,已經(jīng)在中國移動(dòng)一線維護(hù)、優(yōu)化、服務(wù)保障等領(lǐng)域的生產(chǎn)實(shí)踐中經(jīng)過了充分驗(yàn)證,具有現(xiàn)網(wǎng)真實(shí)性、多樣性、數(shù)量多、種類全,覆蓋廣的特點(diǎn),涵蓋網(wǎng)絡(luò)智能感知、預(yù)測、診斷、決策等多項(xiàng)能力場景,能夠?yàn)榫W(wǎng)絡(luò)智能化創(chuàng)新能力研發(fā)孵化提供數(shù)據(jù)基礎(chǔ)。數(shù)據(jù)集詳情如下:
CSI壓縮反饋:復(fù)雜信道環(huán)境的無線信道狀態(tài)信息數(shù)據(jù)及實(shí)測數(shù)據(jù)集,數(shù)據(jù)量級達(dá)到60萬條。該數(shù)據(jù)集可用于訓(xùn)練CSI壓縮反饋等網(wǎng)元智能模型,壓縮UE側(cè)的信道特征信息,并實(shí)現(xiàn)信道狀態(tài)信息的無損還原, 實(shí)現(xiàn)快速準(zhǔn)確的CSI壓縮反饋能力, 提升反饋精度、降低反饋開銷。
光網(wǎng)絡(luò)啞資源合規(guī)檢測:2萬張光交箱、通信桿、光纜等五類場景圖片數(shù)據(jù)集,該數(shù)據(jù)集可用于訓(xùn)練網(wǎng)絡(luò)視覺模型,對傳輸線路中可能存在的啞資源進(jìn)行檢測和識別,打造安全可靠、穩(wěn)定運(yùn)行的光纖傳輸網(wǎng)絡(luò)。
無線側(cè)故障根因分析:現(xiàn)網(wǎng)豐富的無線網(wǎng)絡(luò)運(yùn)維告警數(shù)據(jù)和故障工單數(shù)據(jù),涵蓋130類告警及23類故障原因,數(shù)據(jù)量級達(dá)到460萬條。該數(shù)據(jù)集可用于訓(xùn)練故障根因分析模型,高效快速地定位故障問題,從而 減少實(shí)際派單數(shù)量,優(yōu)化派單策略,節(jié)約人工成本。
無線鏈路質(zhì)量預(yù)測:5G 多樣化業(yè)務(wù)應(yīng)用場景下2萬條高精度時(shí)間分辨率下的無線網(wǎng)絡(luò)狀態(tài)參數(shù)及相應(yīng)用戶業(yè)務(wù)下行速率信息數(shù)據(jù),該數(shù)據(jù)集可用于訓(xùn)練無線鏈路質(zhì)量預(yù)測模型,預(yù)測用戶業(yè)務(wù)下行速率,實(shí)現(xiàn)無線鏈路狀態(tài)實(shí)時(shí)感知,提升用戶視頻業(yè)務(wù)體驗(yàn)和無線網(wǎng)絡(luò)服務(wù)能力,達(dá)到網(wǎng)絡(luò)和業(yè)務(wù)協(xié)同的用戶體驗(yàn)跨層智能優(yōu)化。
無線小區(qū)多指標(biāo)時(shí)空序列預(yù)測:無線通信場景下現(xiàn)網(wǎng)長時(shí)間(2個(gè)月)、大規(guī)模(萬量級)移動(dòng)通信小區(qū)歷史序列數(shù)據(jù),數(shù)據(jù)量級達(dá)到億條,涵蓋流量、用戶數(shù)等重要指標(biāo)及多維度小區(qū)屬性信息,該數(shù)據(jù)集可用于訓(xùn)練時(shí)空聯(lián)合序列預(yù)測模型,預(yù)測 多項(xiàng)小區(qū)性能指標(biāo)的演變趨勢, 從而為網(wǎng)絡(luò)規(guī)劃和維護(hù)工作制定更精準(zhǔn)智能的優(yōu)化策略。
算網(wǎng)異常檢測及故障定位:算力網(wǎng)絡(luò)環(huán)境下網(wǎng)絡(luò)云化設(shè)備運(yùn)行日志數(shù)據(jù),包含154類異常標(biāo)注,數(shù)據(jù)量級達(dá)到60萬 條。該數(shù)據(jù)集可用于建立有效的云網(wǎng)異常檢測模型和根因分析算法模型,實(shí)現(xiàn)快速準(zhǔn)確的云設(shè)備故障檢測并定位故障原因,提升網(wǎng)絡(luò)運(yùn)維效率。
網(wǎng)絡(luò)拓?fù)鋬?yōu)化:面對現(xiàn)網(wǎng)環(huán)境拓?fù)湄?fù)載不均衡的挑戰(zhàn),現(xiàn)網(wǎng)10萬條網(wǎng)絡(luò)拓?fù)溥B接關(guān)系和網(wǎng)元屬性數(shù)據(jù),該數(shù)據(jù)集可用于建立智能網(wǎng)絡(luò)優(yōu)化模型 ,探索網(wǎng)元流量的變化規(guī)律,并據(jù)此對網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)進(jìn)行動(dòng)態(tài)優(yōu)化,實(shí)現(xiàn)網(wǎng)絡(luò)負(fù)載均衡,提高網(wǎng)絡(luò)的性能和可靠性。
數(shù)據(jù)集的發(fā)布得到業(yè)界的高度認(rèn)可
本次數(shù)據(jù)集的發(fā)布得到了中國移動(dòng)各級領(lǐng)導(dǎo)和相關(guān)部門的大力支持。
中國移動(dòng)集團(tuán)公司副總工程師、集團(tuán)級首席科學(xué)家王曉云表示:“高質(zhì)量數(shù)據(jù)是實(shí)現(xiàn)人工智能高質(zhì)量發(fā)展的核心要素。中國移動(dòng)傾力構(gòu)建的這批網(wǎng)絡(luò)精品數(shù)據(jù)集,瞄準(zhǔn)的是解決網(wǎng)絡(luò)智能化領(lǐng)域長期數(shù)據(jù)資源不足、技術(shù)創(chuàng)新路徑受限的產(chǎn)業(yè)難題。相信中國移動(dòng)的貢獻(xiàn),一定能夠?yàn)槲覈斯ぶ悄,特別是網(wǎng)絡(luò)智能化領(lǐng)域的技術(shù)研究、產(chǎn)品研發(fā)、人才培養(yǎng)、生態(tài)建設(shè)帶來全新動(dòng)能。”
中國移動(dòng)集團(tuán)公司技術(shù)部總經(jīng)理陳洪濤表示:“本次開放的7項(xiàng)網(wǎng)絡(luò)數(shù)據(jù)集,覆蓋了多領(lǐng)域的網(wǎng)元、運(yùn)維、服務(wù)智能場景,具有很強(qiáng)的移動(dòng)通信行業(yè)特色和應(yīng)用價(jià)值,這也是中國移動(dòng)建設(shè)“智慧網(wǎng)絡(luò)國家新一代人工智能開放創(chuàng)新平臺”的重要舉措之一,后續(xù)中國移動(dòng)將持續(xù)發(fā)揮自身優(yōu)勢,為產(chǎn)業(yè)開放更多的創(chuàng)新資源,更好的促進(jìn)我國通信+AI技術(shù)的融合創(chuàng)新與突破。”
中國移動(dòng)研究院院長黃宇紅表示:“中國移動(dòng)構(gòu)建的網(wǎng)絡(luò)數(shù)據(jù)集,既著眼當(dāng)下又面向未來,不僅能夠助力現(xiàn)網(wǎng)運(yùn)維優(yōu)化等領(lǐng)域的人工智能算法創(chuàng)新,也能服務(wù)下一代網(wǎng)絡(luò)的前沿技術(shù)研究、方案驗(yàn)證、模擬仿真和標(biāo)準(zhǔn)化等。中國移動(dòng)期待能基于數(shù)據(jù)集的建設(shè)和不斷發(fā)展,與產(chǎn)學(xué)研各界勇闖網(wǎng)絡(luò)新技術(shù)無人區(qū),共同構(gòu)建我國信息通信技術(shù)新優(yōu)勢!”
中國移動(dòng)集團(tuán)級首席科學(xué)家,研究院人工智能與智慧運(yùn)營中心總經(jīng)理馮俊蘭表示:“中國移動(dòng)正在構(gòu)建業(yè)界領(lǐng)先的網(wǎng)絡(luò)大模型,深刻感受到高質(zhì)量數(shù)據(jù)的重要意義,也深知數(shù)據(jù)集的開放共享對于產(chǎn)業(yè)的巨大價(jià)值。我們希望以本次數(shù)據(jù)集的建設(shè)和發(fā)布為新的起點(diǎn),能在網(wǎng)絡(luò)智能化技術(shù)創(chuàng)新方面匯聚更多的產(chǎn)業(yè)力量,攜手攻克智慧網(wǎng)絡(luò)的科學(xué)難題,共同實(shí)現(xiàn)通信網(wǎng)絡(luò)AI+X的發(fā)展新范式。”
中國移動(dòng)集團(tuán)公司網(wǎng)絡(luò)事業(yè)部副總經(jīng)理顧寧倫表示:“中國移動(dòng)充分發(fā)揮自智網(wǎng)絡(luò)子鏈的產(chǎn)業(yè)帶動(dòng)作用,依托現(xiàn)網(wǎng)豐富多樣的數(shù)據(jù)優(yōu)勢,挖掘網(wǎng)絡(luò)智能化痛點(diǎn)問題和生產(chǎn)需求,體系化構(gòu)建多領(lǐng)域、大規(guī)模的移動(dòng)網(wǎng)絡(luò)特色數(shù)據(jù)集。相信本次發(fā)布的數(shù)據(jù)集能夠有效助力網(wǎng)絡(luò)智能感知、診斷、預(yù)測、決策等領(lǐng)域的技術(shù)創(chuàng)新,助力我國自智網(wǎng)絡(luò)加快演進(jìn)升級。”
同時(shí),業(yè)界專家對本次數(shù)據(jù)集的發(fā)布也給予了高度關(guān)注和充分肯定。
北京郵電大學(xué)理學(xué)院副院長、北京郵電大學(xué)-中國移動(dòng)研究院聯(lián)合創(chuàng)新中心主任張建華教授表示:“展望6G,將是通感算智深度融合的移動(dòng)通信信息網(wǎng)絡(luò)。全面、海量、精確的通信網(wǎng)絡(luò)數(shù)據(jù)集,是6G技術(shù)研究和產(chǎn)業(yè)發(fā)展的亟需。我們期待并相信中國移動(dòng)網(wǎng)智數(shù)據(jù)集的開放將為6G與 AI的深度融合技術(shù)創(chuàng)新提供寶貴的數(shù)據(jù)要素。北郵與中國移動(dòng)研究院成立聯(lián)合創(chuàng)新中心以來,在6G信道測量平臺與數(shù)據(jù)集共建方面取得了豐碩成果,共同發(fā)布了面向6G AI空口的信道數(shù)據(jù)集。今后我們將繼續(xù)深化合作,持續(xù)建設(shè)發(fā)布優(yōu)質(zhì)數(shù)據(jù)集,服務(wù)產(chǎn)業(yè)發(fā)展需要。”
新華三集團(tuán)行業(yè)事業(yè)部副總裁、移動(dòng)系統(tǒng)部總經(jīng)理王棟良表示:“在新一輪的產(chǎn)業(yè)變革中,人工智能正在釋放科技革命和產(chǎn)業(yè)革新的巨大能量。而數(shù)據(jù),則是這股能量的關(guān)鍵源泉。自2021年開始,新華三便開始建設(shè)AI數(shù)據(jù)集,我們堅(jiān)信,只有充分挖掘數(shù)據(jù)的潛力,才能推動(dòng)算法不斷升級,加速產(chǎn)業(yè)突破。新華三積極支持移動(dòng)研究院數(shù)據(jù)資源開放共享的建設(shè),提供了大量AI數(shù)據(jù)集,充分挖掘數(shù)據(jù)集潛力,期待與大家攜手共同推動(dòng)數(shù)據(jù)集的落地,助力數(shù)字產(chǎn)業(yè)發(fā)展變革。
未來,中國移動(dòng)將依托“智慧網(wǎng)絡(luò)國家新一代人工智能開放創(chuàng)新平臺”,建設(shè)并開放更多優(yōu)質(zhì)網(wǎng)智數(shù)據(jù)集,為我國通信領(lǐng)域智能化技術(shù)突破、產(chǎn)業(yè)發(fā)展和通信+AI復(fù)合型人才的培養(yǎng)做出更大的貢獻(xiàn)。