四兩撥千斤! 創新工場首席科學家AI大牛周明博士率瀾舟團隊刷新CLUE新紀錄,輕量化模型孟子一鳴驚人!
本週,中文語言理解權威評測基準CLUE榜單,被「低調」刷新。
不同的是,不是大公司、不是超大模型……
一個新面孔,一個輕量化模型,首戰即登頂,四兩撥千斤。
CLUE榜單近年來由巨頭——騰訊、搜狗、華為、阿里達摩院輪番霸榜的格局,被首次打破。
瀾舟科技-創新工場推出的孟子模型,以十億參數完成了此前百億、千億參數模型刷新的紀錄。
這也是瀾舟科技首次對外曝光,背後團隊負責人,正是創新工場首席科學家、全球AI大牛周明博士。以下文章解釋了這個模型的原理,文章來自《量子位》微信公眾號,經授權轉載。
▎輕量化模型孟子?
孟子,基於瀾舟團隊自研技術研發的大規模預訓練語言模型。
包括創新工場、上海交通大學、北京理工大學等單位參與聯合研發。
可處理多語言、多模態數據,同時支持多種文本理解和文本生成任務,能快速滿足不同領域、不同應用場景的需求。
孟子模型基於Transformer架構,僅包含十億參數量,基於數百G級別涵蓋互聯網網頁、社區、新聞、電子商務、金融等領域的高質量語料訓練。
但誰也沒想到,小模型卻有大智慧,一經登場,打破格局。
CLUE,中文語言理解領域最具權威性的測評基準,涵蓋文本相似度、分類、自然語言推理、閱讀理解等共10項語義分析和理解類子任務。
該榜單競爭激烈,幾乎是業內所有自然語言理解玩家必爭之地。
騰訊、搜狗、華為、阿里達摩院等更是輪番霸榜刷新紀錄。
而且隨著大參數模型愈演愈烈,CLUE還漸有巨頭壟斷之勢。
因為百億、千億甚至萬億參數的大模型,已然不再是創業或其他玩家可與之爭鋒。
萬萬沒想到,瀾舟科技-創新工場團隊出手,四兩撥千斤。
因為孟子,走的是基於輕量級、高效訓練的研究路線,致力於構建十億級別的小模型,充分發揮已有參數下的模型潛力,有利於快速、低成本地落地現實業務場景。
孟子預訓練模型性能比肩甚至超越千億大模型,在包含文本分類、閱讀理解等各類任務上表現出色。
相對已有的中文語言模型,孟子模型實現了多項突破性進展:
1) 堅持「小而精」的輕量化訓練策略。實現在同等模型規模下,遠超公開模型的性能。作為精巧的小模型,對標「巨無霸」,小模型性能超越千億規模模型。
2)使用知識圖譜增強模型,讓 AI 真正獲得知識。孟子模型具備頂尖的語言理解能力,在權威CLUE中文理解評測的總排行榜,以及分類排行榜和閱讀理解排行榜均位列第一,刷新三項榜單世界紀錄。總排行榜分數突破84分,逼近人類基準分數(85.61)。
3)靈活的領域和場景適應能力,方便快速定制和應用。基於T5-style的端到端生成的訓練範式,同步適配BERT-style的判定式架構,既能理解也能生成。便於適配行業應用,覆蓋廣泛業務場景。
當然,隨著孟子一鳴驚人,也必然能讓輕量化模型研究來到聚光燈下。
▎原理方法和應用?
在輕量化模型算法研究方面,基於自研的基於語言學知識、知識圖譜和領域數據增強等技術,從模型架構(包括基礎層Embedding表示和交互層Attention機制)到預訓練策略進行了全方位改進。
具體有四方面:
1) 模型結構方面,將語義角色、詞性標註等語言學特徵融合到Embedding表示中,基於句法約束引入註意力機制中,從而提升模型對語言學知識的建模能力。
2) 訓練策略上,引入基於實體知識和Discourse的Mask機制,強化模型對語言成分和語篇關係的表徵。
3) 為進一步提高訓練效率,使用了大模型蒸餾和初始化小模型策略。
4) 為更好地將孟子模型適應垂直領域如金融、營銷,使用了領域數據繼續訓練並構造相應的提示模版(Prompt),取得了明顯的性能提升。
基於以上算法策略,實現從語料中高效學習涵蓋詞級、句子級和語篇級知識,大幅提升語言模型提煉語言結構和語義信息能力,以及良好的領域遷移能力,適應廣泛的產品應用場景。
另外,在Finetune的進展方面,如何將預訓練模型用於各項任務?
瀾舟團隊也有總結,從數據增強、知識蒸餾、遷移訓練、訓練優化等方面展開了一些探索,進一步提升語言模型的性能:
1) 數據增強:使用領域相關數據;
2) 知識蒸餾:基於Teacher-Student自蒸餾提升訓練效率;
3) 遷移訓練:結合課程學習的思想,由易到難訓練下游模型;
4) 訓練優化:使用多種訓練目標,多角度提升模型能力;
而且孟子還已經展開了垂直化領域應用。
基於領域適應技術,孟子模型已深度垂直化賦能相應行業。典型的例子為適用於金融領域的孟子模型,領域適應策略主要包含兩大方面:
1) 通過大規模的泛金融領域語料,將通用孟子模型遷移到金融領域。金融版孟子模型已經應用於多個金融行業的合作企業,在金融知識圖譜搭建、脫水研報、公告抽取等多個任務上獲得了出色的表現。
2) 通過大規模的營銷領域語料,將孟子模型遷移到數字營銷領域,完成了營銷文案生成、新聞摘要等多項任務,將用於行業頭部的數字營銷公司和多個世界五百強企業的合作之中。
瀾舟方面還透露,孟子模型已在多個領域成功落地實踐,衍生出多項行業領先的產品,涵蓋文本生成、行業搜索、機器翻譯等諸多領域。
並且毫無疑問的是,因為輕量級模型具有的模型參數較少、快速推斷的特點,更易於線上部署和推廣到移動設備中,自然不會局限於現有應用和場景,接下來還會有更廣泛的研究和應用場景中。
▎瀾舟團隊?
最後,也簡單介紹本次一鳴驚人的新面孔瀾舟科技。
瀾舟科技是創新工場孵化的一家認知智能公司。公司創始人——周明博士。
AI領域內,周明已不用過多介紹,他是公認的世界級AI科學家,自然語言處理領域的代表性人物。
周明博士在2020年加盟創新工場,擔任創新工場首席科學家。
而瀾舟科技則針對商業場景的數字化轉型,基於大數據、知識圖譜和行業模型,提供新一代的信息檢索、知識推理和商業洞見技術和相關產品。
據稱目前已與國內外幾十所著名高校和十餘個相關領域的頭部企業建立了穩定的合作關係。
值得注意的是,瀾舟科技除了大牛坐鎮,其實也是行業趨勢的體現。
引用創新工場董事長兼CEO李開復最新分享來說:
AI的發展可以按照兩個時間點劃分。
第一個時間點是2015年,以CNN為核心的計算機視覺技術讓機器超越了人類,帶來了人臉識別、智能質檢、無人零售、智慧城市、無人駕駛等商機。
而第二個時間點出現在2019年,以大模型為代表的自然語言方向取得突破性進展,讓NLP從數據、信息走向知識和洞見成為可能,將會在翻譯、語音識別、法律、金融、新聞、廣告、醫療、娛樂等大賽道帶來機遇。
「如果說CNN造就了今天計算機視覺領域的突破和眾多應用,預訓練大模型+微調也將帶來自然語言的百花齊放的發展,用數據智能驅動各類業務的升級。瀾舟科技在周明老師的帶領下取得了今天的成果,在新機遇面前躬身入局,一起發掘NLP領域的黃金發展期」,李開復說到。
上海交通 大學 分數 在 BennyLeung.com Facebook 的最佳貼文
500大學生賣豬肉:是喜是憂,高教何去何從?
新華網報導,由北京大學畢業生創辦的“壹號土豬”品牌,吸納了500多名高校畢業生,相繼加入“養豬賣肉”的行列。
這一事件引發了廣泛的輿論關注。大學畢業生如此就業,是高等教育的悲哀?還是開闢了更多發展路徑?是社會需要的適應?還是人力資源的浪費?
名牌大學畢業,就業從零開始
1月25日,號稱中國“土豬大王”的“壹號土豬”品牌,在上海6個區縣的12家農貿市場登陸。除了“原生態”土豬肉吸引眼球外,創業老闆是北京大學畢業生,員工中有500多名大學生且10%畢業于名牌大學,成為最大關注點。
“參與問答就送二兩豬肉嘞!”30日傍晚,記者在上海市長寧區澳華農產品市場“壹號土豬”店面前看到,圍觀、諮詢、買肉的顧客絡繹不絕。幾個“90後”滿臉書生氣的小夥子,忙碌地吆喝著,一邊還熟練地切肉、稱重、收錢。開業一週,他們積攢了不少“回頭客”。
畢業于江西財經大學人力資源管理專業的郝承兵,當了四年“賣肉倌”,如今從一線員工晉陞為區域經理,年薪10萬元,有房、有車。在他身邊的3名員工,也是大學畢業不久的新人,月收入3000多元。
“2008年參加校園招聘的時候,壹號食品股份有限公司人力資源部經理問我,你大學交女朋友了嗎,我說沒有。他又問了我一句,那你大學四年裏幹了些什麼,我當時就懵了。”郝承兵說,“大學四年,真的沒有學到太多在社會上有用的東西。”
“壹號土豬”創始人陳生,成了一些大學生的榜樣。1984年,陳生畢業于北京大學經濟學(當時叫政治經濟學)專業,“那天學校人事處老師看著我的個人資料,說讀這個專業該分到哪個單位呢?”陳生在接受記者採訪時說,“後來我‘下海’摸索了一段時間,發現自己對養豬賣肉最有心得,就決定做這方面的企業。”
“你學經濟學專業的,讀資本論和賣豬肉有什麼關係?”有人問他。“就算是在北大、清華,專業教育又能包含多少生存競爭的技能?”陳生說,在“壹號土豬”,大學生可以學到“怎麼自我定位,這個社會是怎麼運作的,並且擁有一技之長”。另一方面,“大學生的廣闊視野、與人溝通的能力,也能將經營理念更好地傳播與實現”。
紛紛放棄專業,高教何去何從
此次事件之前,北大中文系畢業生陸步軒賣豬肉一事就引起了社會關注。有人認為高材生賣肉是人力資源浪費,也有人認為這宣告了應試教育的破產——高分數、高學歷,並非指向讓人羨慕的就業崗位。
一位網民認為,應試教育的核心是唯分數論,由此衍生出一系列功利化傾向,導致學生綜合素質、個性特長和自立意識被忽略。
“沒有一技之長和專業領域內不可替代性,大學生在就業壓力較大的社會背景下,只好與普通百姓‘搶飯碗’。”網民“淡定八戒”說,學校和家長總以為考試成績好,日後就能成為頂尖人才,誰知可能連自己的生存問題也解決不了。
畢業于廣東海洋大學經濟學專業的“壹號土豬”員工徐標獻說:“對於大學剛畢業的我們來說,總想走一條不一樣的路,卻發現自己的能力頗為匱乏。不知道想要什麼,不知道過去的堅持有多大價值?迷茫或許是我們的集體代名詞。”
“賣豬肉以後,我們放下了架子,相互鼓勵,不再糾結理想和現實的差距,而是制訂計劃、按部就班、努力工作,這是一個不斷積蓄能量和認識自我的過程。”徐標獻說。
作為“壹號土豬”員工的大學生們,用實際行動掙脫了應試教育的桎梏。然而,也有一些家長對此難以釋懷。
家住上海市長寧區的姚奶奶告訴記者,對於大學生做“豬肉倌”她並不反對,而換成自己的孩子就不一定能接受,“辛辛苦苦培養了那麼多年,最後跑到菜場裏賣豬肉,肯定不甘心的呀!”
上海紅剛青扁豆生產專業合作社總經理、上海市人大代表王黎娜是一個“85後”,大學專業是市場行銷,她在銀行工作兩年後辭職務農,成為著名的“扁豆姑娘”。她認為,“職業無貴賤,三百六十行,行行出狀元”。
專家指出,將學生培養成為自食其力的勞動者,是一種值得推崇的成才理念,一味地希望做“人上人”,將過高的目標懸在空中,往往會陷入焦慮和迷惘。
大學教育應培養怎樣的人才
復旦大學高等教育研究所所長熊慶年說,一些人出於應試教育邏輯和功利主義需求,認為大學畢業生不應該賣豬肉,其實從個人發展來說,有什麼不可以?教育是培養人的,應當允許人有不同的發展路徑。“國外名校出來的人也有賣報紙、送牛奶的,不是說高分進名校就一定要高精尖就業。”
另一方面,熊慶年認為,像“壹號土豬”這樣運用現代商業技術運營培育的品牌,發揮了大學畢業生的知識、能力和特長,值得鼓勵和讚賞。“很多家長可能對行業本身有不正確的看法,這與社會風氣有關。社會功利主義色彩不改,教育領域也無法改革。”
同時,專家認為,大學畢業生賣豬肉一事說明,大學時代所學專業與就業需求並不一致,如何培養學生走向社會的競爭力?怎樣讓學生能夠德智體美全面發展,擁有賴以生存的一技之長?這些值得教育工作者認真反思和研究。
華東師範大學社會學研究所所長文軍教授表示,我國高等教育資源還是很有限的,接受了高等教育之後去賣豬肉,從某種意義上講是對資源的浪費。“這也暴露了高校專業設置和社會需求的對接不夠,人才培養過程中,應用學科跟不上社會發展的要求等。”
高等教育本質上是為了提高學生的獨立思考、判斷能力。上海交通大學就業指導中心主任錢靜峰說,“應用型學科可以強調學以致用,特別是人文、社會科學一類的學科,應該注重廣闊視野和綜合素質的培養,強調學生對自我和社會發展趨勢的把握。”
上海交通 大學 分數 在 辣媽英文天后林俐Carol - 「老師~~~我終於拿到上海交大的 ... 的美食出口停車場
然後還有很重要的一點,上海復旦大學跟上海交通大學的世界排名都在台大前面,更別說北大清華,且每年都在持續上升,然後經費超多。 ... 大陸每個學校都是獨立招生,跟台灣的 ... ... <看更多>
上海交通 大學 分數 在 #比較#上海交大醫學院#台大三類 - 新生季板 | Dcard 的美食出口停車場
借哥哥的帳號發問我的分數大概落點勉強私立的牙醫系但自己很想讀台大牙醫雖已錄取上海交大的牙醫相關科系但選填志願的這幾天卻又萌生想重考的念頭否則 ... ... <看更多>