AI的未來?你不能不認識的人工智慧與資料科學自動化技術—AutoML(3/10)
二、模型選擇(Model Selection)
模型選擇在建立良好的機器學習模型中有著至關重要的作用。模型選擇是從訓練資料集的候選機器學習模型集合中,選擇一個最終機器學習模型的過程。模型選擇是可以同時應用於不同類型的模型(例如,邏輯回歸、SVM、KNN等)以及配置有不同模型超參數的相同類型的模型的過程。前述之Auto-sklearn是基於scikit-learn的自動化套件,是一種自動模型選擇的工具。另外還有H2O AutoML,除了有自動模型選擇功能外,也能產生高預測性的集成學習(ensemble learning)模型,圖為H2O software stack,引用自https://docs.h2o.ai/h2o/latest-stable/h2o-docs/architecture.html
同時也有10000部Youtube影片,追蹤數超過2,910的網紅コバにゃんチャンネル,也在其Youtube影片中提到,...
「sklearn model selection」的推薦目錄:
sklearn model selection 在 工研院巨量資訊科技中心 - ITRI Facebook 的最讚貼文
AI的未來?你不能不認識的人工智慧與資料科學自動化技術—AutoML(1/10)
隨著大數據、更進階的資料分析和預測模型的出現,當今的資料科學家有望在處理人工智慧和機器學習(Machine Learning)方面擁有更多、更新穎的能力與技術,但是同時擁有許多高階技術的資料科學家並不容易找到。然而,一旦彌合技術的差距,這群人不僅能夠生存,而且還能夠使用最佳的診斷和預測分析工具來構建模型。AutoML具有執行資料前處理 (data pre-processing)、自動進行模型選擇(model selection)、對模型進行評估(evaluation)和超參數最佳化調整(hyperparameter tuning)的能力,很可能會成為2020年最流行的趨勢。AutoML套件像是Auto-sklearn可以自動進行模型選擇,對模型進行評估和超參數優化調整。而像是Amazon Forecast和Google的Cloud AutoML等的服務還有助於確定最適合資料的演算法。AutoML的運作方式可參考附圖。
根據 [1] 此研究報告,全球資料爆炸未來將增加10倍,因此資料分析(data analytics)、人工智慧、機器學習和資料科學(data science)領域將迎來一波資料培訓浪潮。而這就是為什麼隨著資料量的增加,AutoML可能成為2020年最常用的技術的原因。
[1] https://analyticsindiamag.com/why-2020-will-be-the-year-of-automl/
圖片引用自https://cloud.google.com/automl