辨識一張新的人臉,需要從該人臉中找到基準點,提取出一個人臉圖,令這幅圖和現有的人臉束圖之間的相似度最大。經過彈性圖匹配後,新的人臉束圖將被提取出來,用它作為特徵進行辨識,並計算測試人臉和現有人臉束圖之間的所有相似度,相似度最大的人臉的身份即為測試人臉的身份……
人臉相似度計算 在 Facebook 的最佳貼文
四兩撥千斤! 創新工場首席科學家AI大牛周明博士率瀾舟團隊刷新CLUE新紀錄,輕量化模型孟子一鳴驚人!
本週,中文語言理解權威評測基準CLUE榜單,被「低調」刷新。
不同的是,不是大公司、不是超大模型……
一個新面孔,一個輕量化模型,首戰即登頂,四兩撥千斤。
CLUE榜單近年來由巨頭——騰訊、搜狗、華為、阿里達摩院輪番霸榜的格局,被首次打破。
瀾舟科技-創新工場推出的孟子模型,以十億參數完成了此前百億、千億參數模型刷新的紀錄。
這也是瀾舟科技首次對外曝光,背後團隊負責人,正是創新工場首席科學家、全球AI大牛周明博士。以下文章解釋了這個模型的原理,文章來自《量子位》微信公眾號,經授權轉載。
▎輕量化模型孟子?
孟子,基於瀾舟團隊自研技術研發的大規模預訓練語言模型。
包括創新工場、上海交通大學、北京理工大學等單位參與聯合研發。
可處理多語言、多模態數據,同時支持多種文本理解和文本生成任務,能快速滿足不同領域、不同應用場景的需求。
孟子模型基於Transformer架構,僅包含十億參數量,基於數百G級別涵蓋互聯網網頁、社區、新聞、電子商務、金融等領域的高質量語料訓練。
但誰也沒想到,小模型卻有大智慧,一經登場,打破格局。
CLUE,中文語言理解領域最具權威性的測評基準,涵蓋文本相似度、分類、自然語言推理、閱讀理解等共10項語義分析和理解類子任務。
該榜單競爭激烈,幾乎是業內所有自然語言理解玩家必爭之地。
騰訊、搜狗、華為、阿里達摩院等更是輪番霸榜刷新紀錄。
而且隨著大參數模型愈演愈烈,CLUE還漸有巨頭壟斷之勢。
因為百億、千億甚至萬億參數的大模型,已然不再是創業或其他玩家可與之爭鋒。
萬萬沒想到,瀾舟科技-創新工場團隊出手,四兩撥千斤。
因為孟子,走的是基於輕量級、高效訓練的研究路線,致力於構建十億級別的小模型,充分發揮已有參數下的模型潛力,有利於快速、低成本地落地現實業務場景。
孟子預訓練模型性能比肩甚至超越千億大模型,在包含文本分類、閱讀理解等各類任務上表現出色。
相對已有的中文語言模型,孟子模型實現了多項突破性進展:
1) 堅持「小而精」的輕量化訓練策略。實現在同等模型規模下,遠超公開模型的性能。作為精巧的小模型,對標「巨無霸」,小模型性能超越千億規模模型。
2)使用知識圖譜增強模型,讓 AI 真正獲得知識。孟子模型具備頂尖的語言理解能力,在權威CLUE中文理解評測的總排行榜,以及分類排行榜和閱讀理解排行榜均位列第一,刷新三項榜單世界紀錄。總排行榜分數突破84分,逼近人類基準分數(85.61)。
3)靈活的領域和場景適應能力,方便快速定制和應用。基於T5-style的端到端生成的訓練範式,同步適配BERT-style的判定式架構,既能理解也能生成。便於適配行業應用,覆蓋廣泛業務場景。
當然,隨著孟子一鳴驚人,也必然能讓輕量化模型研究來到聚光燈下。
▎原理方法和應用?
在輕量化模型算法研究方面,基於自研的基於語言學知識、知識圖譜和領域數據增強等技術,從模型架構(包括基礎層Embedding表示和交互層Attention機制)到預訓練策略進行了全方位改進。
具體有四方面:
1) 模型結構方面,將語義角色、詞性標註等語言學特徵融合到Embedding表示中,基於句法約束引入註意力機制中,從而提升模型對語言學知識的建模能力。
2) 訓練策略上,引入基於實體知識和Discourse的Mask機制,強化模型對語言成分和語篇關係的表徵。
3) 為進一步提高訓練效率,使用了大模型蒸餾和初始化小模型策略。
4) 為更好地將孟子模型適應垂直領域如金融、營銷,使用了領域數據繼續訓練並構造相應的提示模版(Prompt),取得了明顯的性能提升。
基於以上算法策略,實現從語料中高效學習涵蓋詞級、句子級和語篇級知識,大幅提升語言模型提煉語言結構和語義信息能力,以及良好的領域遷移能力,適應廣泛的產品應用場景。
另外,在Finetune的進展方面,如何將預訓練模型用於各項任務?
瀾舟團隊也有總結,從數據增強、知識蒸餾、遷移訓練、訓練優化等方面展開了一些探索,進一步提升語言模型的性能:
1) 數據增強:使用領域相關數據;
2) 知識蒸餾:基於Teacher-Student自蒸餾提升訓練效率;
3) 遷移訓練:結合課程學習的思想,由易到難訓練下游模型;
4) 訓練優化:使用多種訓練目標,多角度提升模型能力;
而且孟子還已經展開了垂直化領域應用。
基於領域適應技術,孟子模型已深度垂直化賦能相應行業。典型的例子為適用於金融領域的孟子模型,領域適應策略主要包含兩大方面:
1) 通過大規模的泛金融領域語料,將通用孟子模型遷移到金融領域。金融版孟子模型已經應用於多個金融行業的合作企業,在金融知識圖譜搭建、脫水研報、公告抽取等多個任務上獲得了出色的表現。
2) 通過大規模的營銷領域語料,將孟子模型遷移到數字營銷領域,完成了營銷文案生成、新聞摘要等多項任務,將用於行業頭部的數字營銷公司和多個世界五百強企業的合作之中。
瀾舟方面還透露,孟子模型已在多個領域成功落地實踐,衍生出多項行業領先的產品,涵蓋文本生成、行業搜索、機器翻譯等諸多領域。
並且毫無疑問的是,因為輕量級模型具有的模型參數較少、快速推斷的特點,更易於線上部署和推廣到移動設備中,自然不會局限於現有應用和場景,接下來還會有更廣泛的研究和應用場景中。
▎瀾舟團隊?
最後,也簡單介紹本次一鳴驚人的新面孔瀾舟科技。
瀾舟科技是創新工場孵化的一家認知智能公司。公司創始人——周明博士。
AI領域內,周明已不用過多介紹,他是公認的世界級AI科學家,自然語言處理領域的代表性人物。
周明博士在2020年加盟創新工場,擔任創新工場首席科學家。
而瀾舟科技則針對商業場景的數字化轉型,基於大數據、知識圖譜和行業模型,提供新一代的信息檢索、知識推理和商業洞見技術和相關產品。
據稱目前已與國內外幾十所著名高校和十餘個相關領域的頭部企業建立了穩定的合作關係。
值得注意的是,瀾舟科技除了大牛坐鎮,其實也是行業趨勢的體現。
引用創新工場董事長兼CEO李開復最新分享來說:
AI的發展可以按照兩個時間點劃分。
第一個時間點是2015年,以CNN為核心的計算機視覺技術讓機器超越了人類,帶來了人臉識別、智能質檢、無人零售、智慧城市、無人駕駛等商機。
而第二個時間點出現在2019年,以大模型為代表的自然語言方向取得突破性進展,讓NLP從數據、信息走向知識和洞見成為可能,將會在翻譯、語音識別、法律、金融、新聞、廣告、醫療、娛樂等大賽道帶來機遇。
「如果說CNN造就了今天計算機視覺領域的突破和眾多應用,預訓練大模型+微調也將帶來自然語言的百花齊放的發展,用數據智能驅動各類業務的升級。瀾舟科技在周明老師的帶領下取得了今天的成果,在新機遇面前躬身入局,一起發掘NLP領域的黃金發展期」,李開復說到。
人臉相似度計算 在 陳滄江 金門小板凳 Facebook 的最佳解答
迷失的金門
1.大陸釀酒事件
金門酒廠對金門的重要性不言可喻,無須贅述。
金酒在臺灣市占率已超過八成,要想擴大經營,機會在大陸。
大陸市場在陳福海當選縣長後,不僅沒有成長,而且萎縮,甚至虧損。
在大陸沒有業績情況下,說東北釀酒是為了金酒未來布局基本是胡扯,這幾年當年度現釀的酒都供大於求,完全沒有供應不足情況,更何況酒廠、經銷商及民眾手中庫存還很多,金酒生產線還有一條未開!(印象中,若有誤請指正)
打開大陸市場後才需要增設廠房,增加產量,開拓市場是一個漸進的過程,不會下個月就忽然增加十億營業額,造成產量來不及供應,因此等到業績增加再來評估建新廠或增加生產線都還得及。並且現行法規是禁止赴陸設廠,說試釀為了金酒未來預先佈局理由實在牽強。
金酒公司既然說金酒不能異地複製,那還千里迢迢遠赴東北試釀是為了什麼,早知不能複製,又冒著酒麴菌種流出的商業風險、被民眾懷疑不信任的政治風險,於情於理都說不過去。
大陸市場若能打開新局面,代表消費者認同金酒口味,他們要喝的是金門香型在地的高粱酒,不是東北口味的金門高粱酒,所以不論是從擴大金酒版圖、增加縣民就業機會抑或是維持金酒的品質等考量來看,增加產量建設廠房的地方,第一選擇應該是金門而非東北。
我們要問的是,研究金門幾十年的陳福海,加上專業的金酒董事會團隊,會不知道這些簡單的道理嗎?為何先否決議員的建議案,後又做出試釀決定?為何是派機要率團試釀,而非酒廠專業人員?為何不是金酒董事會的專業決定,而是縣政府決策小組拍板?若真的是政策考量,為何不能對縣民說清楚?
再從被議員揭發後金酒與縣府人員的回應來看,一開始被踢爆先說是因應議員的提案而做出試釀決定,然後被議員打臉縣府早已回文拒絕議員到大陸設廠的提案。先說決策是由下而上,技術部門建議,再被打臉是縣長主持的決策小組所作決議。過程中謊話連篇,如何讓民眾相信。
倘若正心正念,應盡速把資料跟決議過程公布才是正辦,才能解決所有縣民疑惑,金門鄉親的擔心與質疑,於情有依、於理有據!
另外有些人用「金酒製成無秘密」、「勿政治化、應尊重專業」、「選舉議題」來辯護,看似有理,但論述薄弱,恐難以說服人。
一是認為「金酒製成無秘密」酒麴只是製酒的要素之一,並非全部,所以金酒不會被複製。我想是故意引導輿論方向,把問題窄化然後轉移焦點。但就算護航者要故意藉由討論這個問題,模糊焦點,我們也可看出問題所在。
沒錯,環境、水質、跟原料都會讓酒產生不同變化,所以各地酒廠做出來的酒不可能百分之百一樣。但酒麴是酒類香型的關鍵,金門高粱在大陸白酒香型分類中被劃分為獨立的一個香型,稱為金門高粱香型,這正是金門往後在大陸白酒市場上的優勢,如今東北的試釀據大陸的新聞報導,說試釀出的酒與金酒的相似度有8成,若從商業角度而言,這就足以造成金酒的危機,試想口味這麼接近的白酒,只要他打低價策略,金酒經得起這樣的衝擊嗎?
酒麴製作過程的確不是秘密,但裡面的菌種是非常重要的,那些菌種是一代代所流傳下來最優良的菌種,別的廠不會有,這才是大家害怕的原因。
所以現在要知道的是酒麴的去處。
網上資料,金酒製程中500公斤的高粱原料要加入37公斤麴粉發酵,一道酒蒸餾後,再加50公斤麴粉,發酵,蒸餾第二道。
所以1600公斤麴粉可以製成9184公斤高粱酒原料,
金門高粱酒產酒率約4-5成(因高粱品種而有所不同),所以若是五成可產出4592公斤酒液,58度高粱密度約0.884,所以可造出4592*1.116*等於5124公升的58度高粱酒。也就是8541瓶600CC的酒。
根據新聞報導,金酒公司在回答議員質詢時說,東北兩間酒廠產酒率沒有金門高,酒廠發言人說只釀了400公升,帶回60公升檢驗。
我們簡單計算一下,若有4成產酒率則會產出4612公升的酒,3成有3063公升,2成也有2042公升,在金門產量最差的稉姓高粱產酒率是31-38%。所以採最低標準三成再減一成估計也有2000公升左右,而酒廠發言人說總共只釀了400公升,那等於東北兩間酒廠的產酒率只有4%,這樣水準的酒廠根本無法賺錢經營下去,還能跟我們談合作?
另外試釀評估需要多少的樣本才夠,理由是甚麼?還是麴粉原料根本沒有用完,去向呢?
酒麴倒底有無用完,是真正問題所在,酒廠應該完整公布試釀資料,以昭世人。待續
人臉相似度計算 在 人脸对比 的相關結果
人脸相似度 比对. 对2张图片中人脸进行比较,计算两张脸的相似程度,并返回相似度评分,判断两者是否为同一个人. 支持4种图片类型. 支持生活照、证件照、身份证芯片照、 ... ... <看更多>
人臉相似度計算 在 人脸比对 - SKEye人工智能开放平台 的相關結果
计算 两张人脸照片的相似度,用于判断属于同一个人的可能性。 本地上传. 载入. 相似度 ? 人脸比对. 请输入正确的URL地址. 本地上传. ... <看更多>
人臉相似度計算 在 人脸对比/人脸相似度检测- 在线工具 的相關結果
小提示:通过AI 模型对两张照片中的人脸进行比对,在线实时输出结果,相似度超过80% 可判定为同一个人,支持使用生活照和证件照来验证。模型会在对比完成后删除照片,使用 ... ... <看更多>