什麼是新創最需要的幫助?
我認為對新創團隊來說,資金跟辦公空間都還好處理,但是如果要做突破性的技術,往往會受到規模不夠的限制。
因為新創講求快速反應,常以短小精悍的團隊來運作。可是如果遇到較大的計畫,需要投入很高的開發成本時,就會讓新創團隊退卻。
這次科技部釋出的AI語音數據庫就是令人讚賞的作法
在開發AI語音時,必須搭配完整的語音資料庫來訓練模型,重複地校準、修正,來提升語音辨識的精確度。
可是過去在這一塊,市場缺少完整充裕的中文資料庫,且現有的多以中國為主,不但與台灣的腔調不同,也缺乏穿插台語的使用習慣。因此想開發台灣自己的語音AI,就必須要先建立一個龐大的語音資料庫。可惜的是一般民間機構很難大到像國外一樣成立數據科學團隊,這樣的前期投入,就成了新創的一大障礙。
科技部釋出的語音資料庫不但長達400小時,並且經過人工校對精確標記,可以縮短資料訓練時間,降低語音技術發展門檻,可以說是政府直接提供了民間槍砲彈藥阿!
日前在座談會上我也有提到,科技部的AI中心不應該將自己限縮為一個學術機構,用論文數作為KPI。而是從社會需求中發掘題目,讓自己成為新創的大腦中樞。
科技部投資數百億成立的四個AI中心,應該成為類似 Kaggle 這樣的平台,讓民間來提供數據以及問題,再由AI中心協助找出答案!
像是:
「計程車的浮動費率如何達成供需平衡?」
「哪篇內容農場文是機器人產出的惡意攻擊?」
「如何提升乳房攝影片的乳癌判斷準確率?」
這些都是與社會高度相關,也需要AI中心的技術支援。語音資料庫的作法令業界精神一振,包括我在內的好多科技人,都躍躍欲試地想看能玩出什麼新點子!期待之後的AI中心,能夠化身台灣版的Kaggle,成為民間新創的大腦中樞!
kaggle題目 在 蕭新晟 港湖科技人 Facebook 的精選貼文
什麼是新創最需要的幫助?
我認為對新創團隊來說,資金跟辦公空間都還好處理,但是如果要做突破性的技術,往往會受到規模不夠的限制。
因為新創講求快速反應,常以短小精悍的團隊來運作。可是如果遇到較大的計畫,需要投入很高的開發成本時,就會讓新創團隊退卻。
這次科技部釋出的AI語音數據庫就是令人讚賞的作法
在開發AI語音時,必須搭配完整的語音資料庫來訓練模型,重複地校準、修正,來提升語音辨識的精確度。
可是過去在這一塊,市場缺少完整充裕的中文資料庫,且現有的多以中國為主,不但與台灣的腔調不同,也缺乏穿插台語的使用習慣。因此想開發台灣自己的語音AI,就必須要先建立一個龐大的語音資料庫。可惜的是一般民間機構很難大到像國外一樣成立數據科學團隊,這樣的前期投入,就成了新創的一大障礙。
科技部釋出的語音資料庫不但長達400小時,並且經過人工校對精確標記,可以縮短資料訓練時間,降低語音技術發展門檻,可以說是政府直接提供了民間槍砲彈藥阿!
日前在座談會上我也有提到,科技部的AI中心不應該將自己限縮為一個學術機構,用論文數作為KPI。而是從社會需求中發掘題目,讓自己成為新創的大腦中樞。
科技部投資數百億成立的四個AI中心,應該成為類似 Kaggle 這樣的平台,讓民間來提供數據以及問題,再由AI中心協助找出答案!
像是:
「計程車的浮動費率如何達成供需平衡?」
「哪篇內容農場文是機器人產出的惡意攻擊?」
「如何提升乳房攝影片的乳癌判斷準確率?」
這些都是與社會高度相關,也需要AI中心的技術支援。語音資料庫的作法令業界精神一振,包括我在內的好多科技人,都躍躍欲試地想看能玩出什麼新點子!期待之後的AI中心,能夠化身台灣版的Kaggle,成為民間新創的大腦中樞!