四兩撥千斤! 創新工場首席科學家AI大牛周明博士率瀾舟團隊刷新CLUE新紀錄,輕量化模型孟子一鳴驚人!
本週,中文語言理解權威評測基準CLUE榜單,被「低調」刷新。
不同的是,不是大公司、不是超大模型……
一個新面孔,一個輕量化模型,首戰即登頂,四兩撥千斤。
CLUE榜單近年來由巨頭——騰訊、搜狗、華為、阿里達摩院輪番霸榜的格局,被首次打破。
瀾舟科技-創新工場推出的孟子模型,以十億參數完成了此前百億、千億參數模型刷新的紀錄。
這也是瀾舟科技首次對外曝光,背後團隊負責人,正是創新工場首席科學家、全球AI大牛周明博士。以下文章解釋了這個模型的原理,文章來自《量子位》微信公眾號,經授權轉載。
▎輕量化模型孟子?
孟子,基於瀾舟團隊自研技術研發的大規模預訓練語言模型。
包括創新工場、上海交通大學、北京理工大學等單位參與聯合研發。
可處理多語言、多模態數據,同時支持多種文本理解和文本生成任務,能快速滿足不同領域、不同應用場景的需求。
孟子模型基於Transformer架構,僅包含十億參數量,基於數百G級別涵蓋互聯網網頁、社區、新聞、電子商務、金融等領域的高質量語料訓練。
但誰也沒想到,小模型卻有大智慧,一經登場,打破格局。
CLUE,中文語言理解領域最具權威性的測評基準,涵蓋文本相似度、分類、自然語言推理、閱讀理解等共10項語義分析和理解類子任務。
該榜單競爭激烈,幾乎是業內所有自然語言理解玩家必爭之地。
騰訊、搜狗、華為、阿里達摩院等更是輪番霸榜刷新紀錄。
而且隨著大參數模型愈演愈烈,CLUE還漸有巨頭壟斷之勢。
因為百億、千億甚至萬億參數的大模型,已然不再是創業或其他玩家可與之爭鋒。
萬萬沒想到,瀾舟科技-創新工場團隊出手,四兩撥千斤。
因為孟子,走的是基於輕量級、高效訓練的研究路線,致力於構建十億級別的小模型,充分發揮已有參數下的模型潛力,有利於快速、低成本地落地現實業務場景。
孟子預訓練模型性能比肩甚至超越千億大模型,在包含文本分類、閱讀理解等各類任務上表現出色。
相對已有的中文語言模型,孟子模型實現了多項突破性進展:
1) 堅持「小而精」的輕量化訓練策略。實現在同等模型規模下,遠超公開模型的性能。作為精巧的小模型,對標「巨無霸」,小模型性能超越千億規模模型。
2)使用知識圖譜增強模型,讓 AI 真正獲得知識。孟子模型具備頂尖的語言理解能力,在權威CLUE中文理解評測的總排行榜,以及分類排行榜和閱讀理解排行榜均位列第一,刷新三項榜單世界紀錄。總排行榜分數突破84分,逼近人類基準分數(85.61)。
3)靈活的領域和場景適應能力,方便快速定制和應用。基於T5-style的端到端生成的訓練範式,同步適配BERT-style的判定式架構,既能理解也能生成。便於適配行業應用,覆蓋廣泛業務場景。
當然,隨著孟子一鳴驚人,也必然能讓輕量化模型研究來到聚光燈下。
▎原理方法和應用?
在輕量化模型算法研究方面,基於自研的基於語言學知識、知識圖譜和領域數據增強等技術,從模型架構(包括基礎層Embedding表示和交互層Attention機制)到預訓練策略進行了全方位改進。
具體有四方面:
1) 模型結構方面,將語義角色、詞性標註等語言學特徵融合到Embedding表示中,基於句法約束引入註意力機制中,從而提升模型對語言學知識的建模能力。
2) 訓練策略上,引入基於實體知識和Discourse的Mask機制,強化模型對語言成分和語篇關係的表徵。
3) 為進一步提高訓練效率,使用了大模型蒸餾和初始化小模型策略。
4) 為更好地將孟子模型適應垂直領域如金融、營銷,使用了領域數據繼續訓練並構造相應的提示模版(Prompt),取得了明顯的性能提升。
基於以上算法策略,實現從語料中高效學習涵蓋詞級、句子級和語篇級知識,大幅提升語言模型提煉語言結構和語義信息能力,以及良好的領域遷移能力,適應廣泛的產品應用場景。
另外,在Finetune的進展方面,如何將預訓練模型用於各項任務?
瀾舟團隊也有總結,從數據增強、知識蒸餾、遷移訓練、訓練優化等方面展開了一些探索,進一步提升語言模型的性能:
1) 數據增強:使用領域相關數據;
2) 知識蒸餾:基於Teacher-Student自蒸餾提升訓練效率;
3) 遷移訓練:結合課程學習的思想,由易到難訓練下游模型;
4) 訓練優化:使用多種訓練目標,多角度提升模型能力;
而且孟子還已經展開了垂直化領域應用。
基於領域適應技術,孟子模型已深度垂直化賦能相應行業。典型的例子為適用於金融領域的孟子模型,領域適應策略主要包含兩大方面:
1) 通過大規模的泛金融領域語料,將通用孟子模型遷移到金融領域。金融版孟子模型已經應用於多個金融行業的合作企業,在金融知識圖譜搭建、脫水研報、公告抽取等多個任務上獲得了出色的表現。
2) 通過大規模的營銷領域語料,將孟子模型遷移到數字營銷領域,完成了營銷文案生成、新聞摘要等多項任務,將用於行業頭部的數字營銷公司和多個世界五百強企業的合作之中。
瀾舟方面還透露,孟子模型已在多個領域成功落地實踐,衍生出多項行業領先的產品,涵蓋文本生成、行業搜索、機器翻譯等諸多領域。
並且毫無疑問的是,因為輕量級模型具有的模型參數較少、快速推斷的特點,更易於線上部署和推廣到移動設備中,自然不會局限於現有應用和場景,接下來還會有更廣泛的研究和應用場景中。
▎瀾舟團隊?
最後,也簡單介紹本次一鳴驚人的新面孔瀾舟科技。
瀾舟科技是創新工場孵化的一家認知智能公司。公司創始人——周明博士。
AI領域內,周明已不用過多介紹,他是公認的世界級AI科學家,自然語言處理領域的代表性人物。
周明博士在2020年加盟創新工場,擔任創新工場首席科學家。
而瀾舟科技則針對商業場景的數字化轉型,基於大數據、知識圖譜和行業模型,提供新一代的信息檢索、知識推理和商業洞見技術和相關產品。
據稱目前已與國內外幾十所著名高校和十餘個相關領域的頭部企業建立了穩定的合作關係。
值得注意的是,瀾舟科技除了大牛坐鎮,其實也是行業趨勢的體現。
引用創新工場董事長兼CEO李開復最新分享來說:
AI的發展可以按照兩個時間點劃分。
第一個時間點是2015年,以CNN為核心的計算機視覺技術讓機器超越了人類,帶來了人臉識別、智能質檢、無人零售、智慧城市、無人駕駛等商機。
而第二個時間點出現在2019年,以大模型為代表的自然語言方向取得突破性進展,讓NLP從數據、信息走向知識和洞見成為可能,將會在翻譯、語音識別、法律、金融、新聞、廣告、醫療、娛樂等大賽道帶來機遇。
「如果說CNN造就了今天計算機視覺領域的突破和眾多應用,預訓練大模型+微調也將帶來自然語言的百花齊放的發展,用數據智能驅動各類業務的升級。瀾舟科技在周明老師的帶領下取得了今天的成果,在新機遇面前躬身入局,一起發掘NLP領域的黃金發展期」,李開復說到。
同時也有1部Youtube影片,追蹤數超過3萬的網紅Ride? バイクチャンネル,也在其Youtube影片中提到,■2022年4月から11月までの期間、NEXCO3社の高速道路において、バイクの高速料金が大幅割引き! ・対象車両:ETCおよびETC2.0を搭載した二輪車 ・対象期間:2022年4月~11月の土曜日、日曜日、祝日 ・対象道路:NEXCO3社が管理する高速道路 ・申込方法:事前にインターネッ...
bert分類 在 軟體開發學習資訊分享 Facebook 的最佳貼文
利用 Reddit、Twitter 和新聞文章建立6個即時加密貨幣和股票情緒分析交易機器人
從這 5 小時的課程,你會學到
✅ 6種不同的即時情緒分析交易演算法
✅ 對 Reddit、Twitter 和新聞發文進行情緒分析
✅ 透過網路爬取多個網站的有價值資訊
✅ 在即時交易演算法中實施 BERT
✅ 實用演算法交易
✅ Alpaca 和 Binance 交易演算法
✅ 股票和加密貨幣交易機器人
✅ 建立華爾街交易機器人的工具和技能
✅ 使用尖端的 NLP 演算法,如 BERT 進行情緒分類
https://softnshare.com/sentiment-trading-python/
bert分類 在 艾斯 Ace Facebook 的最佳解答
|台北 JB’s Diner & Cafe
ㅤㅤㅤㅤㅤㅤㅤㅤㅤ
說實話,要不是士林最近有幾間想去的店,不然依我的個性才不會大老遠從南港搭乘交通運輸工具自己跑來天母,根本是癡人說夢,畢竟提不起勁的事,並不會使人產生興趣跟動力。
ㅤㅤㅤㅤㅤㅤㅤㅤㅤ
尤其是在沒有汽機車自駕的過程裡,真的是時間漫長蠻搖遠的,難怪我看天母友人出門總是愛叫車,畢竟時間就是金錢,省那一些錢,反而浪費了大好光陰。
ㅤㅤㅤㅤㅤㅤㅤㅤㅤ
想要成為什麼樣的人,就要把自己放在哪個環境,在這每個人的生活好像都慢了下來,但沒有白白浪費,看似慢,其實有著自己的步調。
ㅤㅤㅤㅤㅤㅤㅤㅤㅤ
不熟悉環境的我在朋友帶領之下,來到一家有著160坪寬敞空間的美式餐廳坐下來用餐,是家族共同經營的,JB’s 是祖父母Judy&Bert的縮寫,餐廳有著地中海度假風格,這裡不僅可悠哉的享受早午餐等料理,也能與親朋好友一起好好共度歡樂的時光。
ㅤㅤㅤㅤㅤㅤㅤㅤㅤ
雖然這次點的餐點有些不盡理想,但至少了解到了天母圈子的生活,好在這寬敞截然不同的舒適空間彌補了餐點上的小遺憾。
ㅤㅤㅤㅤㅤㅤㅤㅤㅤ
個人偏愛採光明亮的二樓,純白潔淨的裝潢,讓人很放鬆,天氣晴朗的時候,可以好好享受陽光的溫暖,不過樓上只有假日才開放,平日不開放用餐,但可以上去拍拍空景與美照。
有機會還會想跟三五好友一起來二樓用餐🍴
ㅤㅤㅤㅤㅤㅤㅤㅤㅤ
W/ @momo19911224
ㅤㅤㅤㅤㅤㅤㅤㅤㅤ
____
@judyandbert
#jbsdiner
ㅤㅤㅤㅤㅤㅤㅤㅤㅤ
____
人生是自己的,在生活中不斷去比較,並不會為自己帶來快樂、安全、成就感。
ㅤㅤㅤㅤㅤㅤㅤㅤㅤ
有些人常會因為某些事情而陷入誤區而走不出來,會想去比拼,甚至是比誰的粉絲多。
ㅤㅤㅤㅤㅤㅤㅤㅤㅤ
最後才發現,獲得以後並不會等效地增加快樂、安全感,甚至是說,並沒有帶來成就感。
ㅤㅤㅤㅤㅤㅤㅤㅤㅤ
每個人都有屬於自己的時區,找回自己生命的時間,跟著自己的時區走,或許會輕鬆許多!
ㅤㅤㅤㅤㅤㅤㅤㅤㅤ
____
☞ 門市資訊 ☜
🏠 門市 |JB’s Diner & Cafe
📍 地址 |台北市士林區天玉街38巷16弄
☎️ 電話 |(02)-2876-1588
🕓 時間 |08:00-20:00,週一公休
📜 備註 |可訂位/10%服務費/平日無限時/假日限時120min/每日蛋糕供應品項依據當日現場為主/禁止商業攝影
ㅤㅤㅤㅤㅤㅤㅤㅤㅤ
____
分類標籤🏷️ #Acetri編 #相機食先
ㅤㅤㅤㅤㅤㅤㅤㅤㅤ
地區:#Acetri_Taipei
#台北美食 #台北咖啡廳 #台北咖啡 #台北早午餐 #台北下午茶 #台北景點 #士林區 #士林美食 #士林 #天母美食 #天母
ㅤㅤㅤㅤㅤㅤㅤㅤㅤ
類別:#Acetri_Cafe
#美式餐廳 #美式 #咖啡廳 #咖啡 #早午餐 #下午茶 #寵物友善 #寵物友善餐廳 #美式漢堡 #漢堡 #班尼狄克蛋 #網美景點 #網美集散地 #網美
bert分類 在 Ride? バイクチャンネル Youtube 的精選貼文
■2022年4月から11月までの期間、NEXCO3社の高速道路において、バイクの高速料金が大幅割引き!
・対象車両:ETCおよびETC2.0を搭載した二輪車
・対象期間:2022年4月~11月の土曜日、日曜日、祝日
・対象道路:NEXCO3社が管理する高速道路
・申込方法:事前にインターネットで利用日を指定して申し込み必要
・割引率:100kmを超える走行を対象に37.5%
・開始時期:2022年4月より開始予定
二輪車は「軽自動車等」に分類され、もともと普通車の2割引に設定されており、今回の割引率37.5%というのは、「普通車の半額」に相当します。
**********************************
■『RIDE? ~Hop on the Motorcycle~』って?
オートバイレースの元世界チャンピオン:片山敬済さんと一緒に配信する「バイクチャンネル」。
テーマは、安全に、楽しく、かっこよくバイクライフをおくるためのノウハウやテクニック、考え方や心構えなど。
いっこうにライディングスキルが上達しない、フツー・・・?のライダーの山ちゃんが、誰よりも速く世界中のサーキットを駆け抜けた世界のカタヤマに、バイクの基本的なライディングテクニックやマナー、そして、バイクライフをより豊かに楽しむ為のヒントやヒケツを聞いていきたいと思います。
初心者や中級ライダーは勿論、ベテランライダーの皆さんにとっても、役立つ情報を配信していきたいと思います。
**********************************
■片山敬済アイテムが買えるFacebookページ「Racing Brand "SEKITOBA"」
https://www.facebook.com/groups/sekitoba
■片山敬済さんが代表を務める民間レベルの緊急災害対策チーム「BERT」のオフィシャルサイト
http://bert-japan.org/
■山ちゃんインスタグラム(yamabata_hideaki)
https://www.instagram.com/yamabata_hideaki/
■山ちゃんが動画制作した作品集:Youtubeチャンネル
https://www.youtube.com/c/HIDEAKIYAMABATA
**********************************
#バイク #高速料金 #割引き #片山敬済 #バイク #オートバイ #テクニック #バイク動画 #バイクチャンネル #ライディングテクニック #世界チャンピオン
bert分類 在 #新手關於bert分類器 - 軟體工程師板 | Dcard 的美食出口停車場
最近在學習如何用bert製作分類器環境選的是centos途中遇到好多困難一直失敗想聽聽各位大神架成功bert的經驗分享或是推薦的網站麻煩各位了- 軟體,問題, ... ... <看更多>