四兩撥千斤! 創新工場首席科學家AI大牛周明博士率瀾舟團隊刷新CLUE新紀錄,輕量化模型孟子一鳴驚人!
本週,中文語言理解權威評測基準CLUE榜單,被「低調」刷新。
不同的是,不是大公司、不是超大模型……
一個新面孔,一個輕量化模型,首戰即登頂,四兩撥千斤。
CLUE榜單近年來由巨頭——騰訊、搜狗、華為、阿里達摩院輪番霸榜的格局,被首次打破。
瀾舟科技-創新工場推出的孟子模型,以十億參數完成了此前百億、千億參數模型刷新的紀錄。
這也是瀾舟科技首次對外曝光,背後團隊負責人,正是創新工場首席科學家、全球AI大牛周明博士。以下文章解釋了這個模型的原理,文章來自《量子位》微信公眾號,經授權轉載。
▎輕量化模型孟子?
孟子,基於瀾舟團隊自研技術研發的大規模預訓練語言模型。
包括創新工場、上海交通大學、北京理工大學等單位參與聯合研發。
可處理多語言、多模態數據,同時支持多種文本理解和文本生成任務,能快速滿足不同領域、不同應用場景的需求。
孟子模型基於Transformer架構,僅包含十億參數量,基於數百G級別涵蓋互聯網網頁、社區、新聞、電子商務、金融等領域的高質量語料訓練。
但誰也沒想到,小模型卻有大智慧,一經登場,打破格局。
CLUE,中文語言理解領域最具權威性的測評基準,涵蓋文本相似度、分類、自然語言推理、閱讀理解等共10項語義分析和理解類子任務。
該榜單競爭激烈,幾乎是業內所有自然語言理解玩家必爭之地。
騰訊、搜狗、華為、阿里達摩院等更是輪番霸榜刷新紀錄。
而且隨著大參數模型愈演愈烈,CLUE還漸有巨頭壟斷之勢。
因為百億、千億甚至萬億參數的大模型,已然不再是創業或其他玩家可與之爭鋒。
萬萬沒想到,瀾舟科技-創新工場團隊出手,四兩撥千斤。
因為孟子,走的是基於輕量級、高效訓練的研究路線,致力於構建十億級別的小模型,充分發揮已有參數下的模型潛力,有利於快速、低成本地落地現實業務場景。
孟子預訓練模型性能比肩甚至超越千億大模型,在包含文本分類、閱讀理解等各類任務上表現出色。
相對已有的中文語言模型,孟子模型實現了多項突破性進展:
1) 堅持「小而精」的輕量化訓練策略。實現在同等模型規模下,遠超公開模型的性能。作為精巧的小模型,對標「巨無霸」,小模型性能超越千億規模模型。
2)使用知識圖譜增強模型,讓 AI 真正獲得知識。孟子模型具備頂尖的語言理解能力,在權威CLUE中文理解評測的總排行榜,以及分類排行榜和閱讀理解排行榜均位列第一,刷新三項榜單世界紀錄。總排行榜分數突破84分,逼近人類基準分數(85.61)。
3)靈活的領域和場景適應能力,方便快速定制和應用。基於T5-style的端到端生成的訓練範式,同步適配BERT-style的判定式架構,既能理解也能生成。便於適配行業應用,覆蓋廣泛業務場景。
當然,隨著孟子一鳴驚人,也必然能讓輕量化模型研究來到聚光燈下。
▎原理方法和應用?
在輕量化模型算法研究方面,基於自研的基於語言學知識、知識圖譜和領域數據增強等技術,從模型架構(包括基礎層Embedding表示和交互層Attention機制)到預訓練策略進行了全方位改進。
具體有四方面:
1) 模型結構方面,將語義角色、詞性標註等語言學特徵融合到Embedding表示中,基於句法約束引入註意力機制中,從而提升模型對語言學知識的建模能力。
2) 訓練策略上,引入基於實體知識和Discourse的Mask機制,強化模型對語言成分和語篇關係的表徵。
3) 為進一步提高訓練效率,使用了大模型蒸餾和初始化小模型策略。
4) 為更好地將孟子模型適應垂直領域如金融、營銷,使用了領域數據繼續訓練並構造相應的提示模版(Prompt),取得了明顯的性能提升。
基於以上算法策略,實現從語料中高效學習涵蓋詞級、句子級和語篇級知識,大幅提升語言模型提煉語言結構和語義信息能力,以及良好的領域遷移能力,適應廣泛的產品應用場景。
另外,在Finetune的進展方面,如何將預訓練模型用於各項任務?
瀾舟團隊也有總結,從數據增強、知識蒸餾、遷移訓練、訓練優化等方面展開了一些探索,進一步提升語言模型的性能:
1) 數據增強:使用領域相關數據;
2) 知識蒸餾:基於Teacher-Student自蒸餾提升訓練效率;
3) 遷移訓練:結合課程學習的思想,由易到難訓練下游模型;
4) 訓練優化:使用多種訓練目標,多角度提升模型能力;
而且孟子還已經展開了垂直化領域應用。
基於領域適應技術,孟子模型已深度垂直化賦能相應行業。典型的例子為適用於金融領域的孟子模型,領域適應策略主要包含兩大方面:
1) 通過大規模的泛金融領域語料,將通用孟子模型遷移到金融領域。金融版孟子模型已經應用於多個金融行業的合作企業,在金融知識圖譜搭建、脫水研報、公告抽取等多個任務上獲得了出色的表現。
2) 通過大規模的營銷領域語料,將孟子模型遷移到數字營銷領域,完成了營銷文案生成、新聞摘要等多項任務,將用於行業頭部的數字營銷公司和多個世界五百強企業的合作之中。
瀾舟方面還透露,孟子模型已在多個領域成功落地實踐,衍生出多項行業領先的產品,涵蓋文本生成、行業搜索、機器翻譯等諸多領域。
並且毫無疑問的是,因為輕量級模型具有的模型參數較少、快速推斷的特點,更易於線上部署和推廣到移動設備中,自然不會局限於現有應用和場景,接下來還會有更廣泛的研究和應用場景中。
▎瀾舟團隊?
最後,也簡單介紹本次一鳴驚人的新面孔瀾舟科技。
瀾舟科技是創新工場孵化的一家認知智能公司。公司創始人——周明博士。
AI領域內,周明已不用過多介紹,他是公認的世界級AI科學家,自然語言處理領域的代表性人物。
周明博士在2020年加盟創新工場,擔任創新工場首席科學家。
而瀾舟科技則針對商業場景的數字化轉型,基於大數據、知識圖譜和行業模型,提供新一代的信息檢索、知識推理和商業洞見技術和相關產品。
據稱目前已與國內外幾十所著名高校和十餘個相關領域的頭部企業建立了穩定的合作關係。
值得注意的是,瀾舟科技除了大牛坐鎮,其實也是行業趨勢的體現。
引用創新工場董事長兼CEO李開復最新分享來說:
AI的發展可以按照兩個時間點劃分。
第一個時間點是2015年,以CNN為核心的計算機視覺技術讓機器超越了人類,帶來了人臉識別、智能質檢、無人零售、智慧城市、無人駕駛等商機。
而第二個時間點出現在2019年,以大模型為代表的自然語言方向取得突破性進展,讓NLP從數據、信息走向知識和洞見成為可能,將會在翻譯、語音識別、法律、金融、新聞、廣告、醫療、娛樂等大賽道帶來機遇。
「如果說CNN造就了今天計算機視覺領域的突破和眾多應用,預訓練大模型+微調也將帶來自然語言的百花齊放的發展,用數據智能驅動各類業務的升級。瀾舟科技在周明老師的帶領下取得了今天的成果,在新機遇面前躬身入局,一起發掘NLP領域的黃金發展期」,李開復說到。
同時也有2部Youtube影片,追蹤數超過0的網紅潘孟安Peter Pan,也在其Youtube影片中提到,Xin chào mọi người ! Tôi là Pan-Meng-An 大家平安 我是潘孟安 各位兄弟姐妹馬上分享!超簡單一次看!全國第9類、第10類對象,即日起開放意願登記,快讓更多人知道! ------ 第九類第十類民眾疫苗登記 Bắt đầu từ ngày hô...
多語ai 在 Inside 硬塞的網路趨勢觀察 Facebook 的精選貼文
Facebook 究竟是如何制定內容審查政策的?其實內容政策制定小組分散在全球 11 個辦公室中,每隔兩周舉行一次「政策論壇」,並由多方領域的專家組成,共同討論當前社群守則的變革與制定。
多語ai 在 Facebook 的最讚貼文
很好玩的限時塗鴉,最後還能按下你畫的圖看看AI是如何判斷你的圖,以及其他人畫的圖。
有很多語言可以選,看孩子畫也會很開心!
多語ai 在 潘孟安Peter Pan Youtube 的最讚貼文
Xin chào mọi người ! Tôi là Pan-Meng-An
大家平安 我是潘孟安
各位兄弟姐妹馬上分享!超簡單一次看!全國第9類、第10類對象,即日起開放意願登記,快讓更多人知道!
------
第九類第十類民眾疫苗登記
Bắt đầu từ ngày hôm nay đối tượng thứ 9 và thứ 10
即日起開放
được đăng ký hẹn tiêm vắc-xin
分成兩個階段
Chỉ cần hoàn thành 2 bước
步驟很簡單
Quá trình đăng ký rất đơn giản
首先要先意願登記
Bước thứ nhất chỉ cần
打開1922網站
đăng nhập website 1922
或是健保快易通app
hoặc cài đặt App “健保快易通”
輸入身分證或居留證或是健保卡號碼、手機號碼
nhập số CMND , số thẻ cư trú , số thẻ BHYT , kế đến là số ĐTDĐ
再來選行政區
Tiếp theo là chọn khu vực hành chính
疫苗的種類
thể loại vắc-xin
這樣就可以完成登記
như thế là bạn đã hoàn thành việc đăng ký
之後第二階段
Bước thứ hai
會收到簡訊再上網預約時間地點
là sau khi bạn nhận được tin nhắn phản hồi , thì lại vào website 1922 đăng ký hẹn ngày giờ và địa điểm tiêm
最後依照預約時段前往施打站施打疫苗
Sau cùng, là đúng lịch hẹn thì đến trạm tiêm tiêm vắc-xin
細節會再教大家
Các chi tiết cụ thể sẽ hướng dẫn sau
請大家符合資格者
Những ai thuộc các đối tượng trên
就先意願登記喔
Thì hãy tự nguyện đăng ký nhé !
之前登記已經完成的一樣有效
Trước đây , những ai đã từng đăng ký , thì vẫn còn hiệu lực
不用再登記
nên không cần đăng ký lại
更希望各位年輕人幫家中長輩預約
Các bạn trẻ hãy đăng ký hẹn tiêm vắc-xin hộ phụ huynh của mình nhé !
屏東也推出貼心服務
Tỉnh Bình Đông cũng thực hiện các phục vụ thân thiện như sau :
如果需要協助的可以到各地的戶政地政事務所
Nếu cần sự hỗ trợ , hãy đến trực tiếp cơ quan hộ tịch và địa chính
稅務分局或是衛生所
chi cục thuế hoặc sở y tế
以及各鄉鎮市公所
và các cơ quan thị chính địa phương
屏東市各區里聯合辦公處
Văn phòng liên hiệp tại các phường,xã thuộc thành phố Bình đông
也可以來協助喔!
cũng có hỗ trợ việc đăng ký này!
教大家輕鬆登記!
Hướng dẫn mọi người đăng ký một cách dễ dàng !
台灣疫苗施打進入新階段,分成兩步驟,先意願登記(身分證號OR居留證號、健保卡號一定要),完成後等簡訊通知,再上網預約時間、地點,然後按時段去施打。
很簡單不緊張,符合資格就去預約,屏東更貼心推出協助服務,如果需要就帶雙證件到各戶地政事務所、稅務分局、衛生所以及各鄉鎮市公所(屏東市還能到各區里聯合辦公處)!
我們會翻譯成更多語言,讓大家一分鐘就能看懂!
多語ai 在 公視新聞網 Youtube 的精選貼文
更多新聞與互動請上:
公視新聞網 ( http://news.pts.org.tw )
PNN公視新聞議題中心 ( http://pnn.pts.org.tw/ )
PNN 粉絲專頁 ( https://www.facebook.com/pnnpts/ )
PNN livehouse.in頻道 ( http://livehouse.in/channel/PNNPTS )