這是繼天翼云在中文語(yǔ)言理解零樣本學(xué)習(xí)權(quán)威榜單ZeroCLUE拔得頭籌之后,獲得的又一重要獎(jiǎng)項(xiàng),進(jìn)一步夯實(shí)了天翼云AI在認(rèn)知智能領(lǐng)域的行業(yè)領(lǐng)先地位。
ACL是全球影響力最大、最具活力的國(guó)際學(xué)術(shù)組織之一,是自然語(yǔ)言處理與計(jì)算語(yǔ)言學(xué)領(lǐng)域最具權(quán)威性的專業(yè)學(xué)會(huì)。ACL會(huì)議是NLP領(lǐng)域頂級(jí)會(huì)議,同時(shí)也是CCF 推薦的A類國(guó)際學(xué)術(shù)會(huì)議。而本次WASSA混合語(yǔ)種競(jìng)賽吸引了來(lái)自全球的58個(gè)優(yōu)秀團(tuán)隊(duì)參與。
WASSA 2023成績(jī)排名
情感是人類基本的心理經(jīng)驗(yàn)之一,且難以被定義。在不同語(yǔ)種情境下,人類識(shí)別文本的各類情感具有一定難度,而將這些知識(shí)轉(zhuǎn)移到機(jī)器上,用機(jī)器識(shí)別混合語(yǔ)種(code mixed)文本中蘊(yùn)含的情感將更具挑戰(zhàn)性。WASSA 2023中的混合語(yǔ)種賽事便是針對(duì)混合語(yǔ)種文本多標(biāo)簽情感分類(MLEC)和多類別情感分類(MCEC)舉辦的競(jìng)賽;旌险Z(yǔ)種的每個(gè)樣本中包含憤怒、喜悅、熱愛(ài)等12類情感中的一類或多類,參賽者需要盡可能準(zhǔn)確地識(shí)別各文本樣本中蘊(yùn)含的情感。 本次競(jìng)賽中,天翼云AI團(tuán)隊(duì)的算法重點(diǎn)采用了“提示學(xué)習(xí)”(Prompt Learning)技術(shù)。“提示學(xué)習(xí)”是大模型研究的前沿技術(shù)之一,也被稱為自然語(yǔ)言處理領(lǐng)域的“第四范式”。傳統(tǒng)“預(yù)訓(xùn)練+微調(diào)”的NLP模型應(yīng)用方式不僅會(huì)消耗大量的計(jì)算、存儲(chǔ)資源,也會(huì)浪費(fèi)預(yù)訓(xùn)練模型的泛化能力。應(yīng)用“提示學(xué)習(xí)”技術(shù),則可以通過(guò)設(shè)計(jì)不同的提示詞、無(wú)需進(jìn)行模型微調(diào),就能進(jìn)行下游任務(wù)的適配和部署,這一方式實(shí)現(xiàn)了預(yù)訓(xùn)練模型的高效利用,同時(shí)保留了模型的泛化能力。
模型微調(diào)與提示學(xué)習(xí)的對(duì)比
天翼云AI團(tuán)隊(duì)的算法方案僅使用單張GPU卡就實(shí)現(xiàn)了混合語(yǔ)種情感分類任務(wù)的適配和推理,方案中的數(shù)據(jù)預(yù)處理、提示詞設(shè)計(jì)、數(shù)據(jù)推理全流程可在數(shù)小時(shí)內(nèi)完成。利用少量的算力和存儲(chǔ)資源,算法方案就能高效部署到下游任務(wù)中,這體現(xiàn)了天翼云AI團(tuán)隊(duì)在大模型、認(rèn)知智能領(lǐng)域的技術(shù)沉淀,以及對(duì)相關(guān)業(yè)務(wù)場(chǎng)景的深度理解。
目前,天翼云AI團(tuán)隊(duì)“提示學(xué)習(xí)”技術(shù)已在實(shí)際業(yè)務(wù)中得到廣泛應(yīng)用,尤其是“大模型+提示學(xué)習(xí)”的技術(shù)范式有效地將大模型的能力應(yīng)用到下游各類任務(wù)和業(yè)務(wù)場(chǎng)景中。未來(lái),天翼云將繼續(xù)推進(jìn)人工智能領(lǐng)域技術(shù)創(chuàng)新與突破,加快打造原創(chuàng)技術(shù)策源地,推動(dòng)數(shù)字技術(shù)與產(chǎn)業(yè)深度融合,賦能千行百業(yè)數(shù)字化轉(zhuǎn)型。