✍️【我不是本科生,也可以當資料分析師嗎?】
-
我發現滿多人對於自己不是本科生這件事情會感到迷惘,不論是粉專的私訊詢問、以及我即將要參與一個資料科學領航者活動,也有參加者也會詢問類似的問題,像是:
🧒:「Irene,想詢問若非資工/資管背景,但有在學 python、機器學習、甚至也會用 Kaggle 資料練習,未來能當資料科學家嗎?」
👱♂️:「聽到不少人說資料科學工作領域比較缺有經驗的人,若無相關經驗的轉職者很難跟資工、統計等背景的人競爭,請問如果離職努力自學,為了轉職可行嗎?」
-
我必須說:「有何不可?關鍵在於證明自己有無相關實力」
-
雖然我不能保證所有企業都不看本科生的標籤,但我能確定的是,如果我們都能 #理解本科生的優勢在哪裡,並好好補足那些優勢,那我們絕對有機會脫穎而出。
-
這篇僅以 #資料分析師/ #資料科學家 的角色為例,因為我認為相較之下,這兩個職能因為更需要人文社會思考的面相,所以跨領域轉過來的機會較高,非本科生也能帶有屬於自己的特色轉進來,分享給大家 🙌。
-
#職涯建議 #職涯規劃 #職涯探索 #面試經驗 #面試 #職涯分享 #面試技巧 #資料科學
同時也有1部Youtube影片,追蹤數超過40萬的網紅我要做富翁,也在其Youtube影片中提到,1) Chris生意創業分享會+試堂:https://edu.money-tab.com/chris-sharing 2) 《我要做富翁》網上版登入/APP下載:http://onelink.to/mtapp 3) 緊貼我們社交平台,不錯過任何免費分析/教學: 訂閱YouTube頻道: http...
kaggle 在 軟體開發學習資訊分享 Facebook 的精選貼文
NT 390 特價中
建立 12 個以上的專案,學習 Web 開發、機器學習 + 更多
本課程的主題包括:
程式設計基礎
Python 基礎
Python 基本原理
資料結構
用 Python 做物件導向程式設計
Python 函數語言程式設計
Lambdas
Decorators
Generators
以 Python 進行測試
除錯
錯誤處理
正規表示式( Regular Expression )
Comprehensions
模組 ( Modules )
虛擬環境
開發環境(PyCharm,Jupyter 筆記本,VS Code,Sublime Text + 更多)
檔案處理: 影像,CSV,PDF,Text + 更多
用 Python 進行 Web 開發
利用 Python 進行機器學習
資料科學與 Python
使用 Python 和 Selenium 實現自動化
使用 Python 編寫指令碼( Scripting )
利用 Python 與 BeautifulSoup 進行 Web Scraping
影像檢測
資料視覺化
Kaggle,Pandas,NumPy,scikit-learn
用 Python 處理電郵及短訊
使用 API (Twitter Bot、密碼檢查器、翻譯器)
https://softnshare.com/complete-python-developer-zero-to-mastery/
kaggle 在 軟體開發學習資訊分享 Facebook 的最佳解答
🔥 NT330 特價中
課程已於 2021 年 8 月更新
學習資料科學、資料分析、機器學習(人工智慧)和 Python 與 Tensorflow、Pandas 和更多 !
本課程的主題包括 :
資料探索與視覺化
神經網路和深度學習
模型評估與分析
Python 3
Tensorflow 2.0
Numpy
Scikit-Learn
資料科學與機器學習專案和工作流程
在 Python 用 MatPlotLib 和 Seaborn 做資料視覺化
轉移學習( Transfer Learning )
影像辨識和分類
訓練/測試並交叉驗證
監督學習 : 分類、迴歸和時間序列
決策樹和隨機森林
整體學習( Ensemble Learning )
調整超參數( Hyperparameter Tuning )
採用 Pandas 資料框解決複雜任務
採用 Pandas 處理 CSV 檔
採用 TensorFlow 2.0 和 Keras深度學習 / 神經網路
使用 Kaggle 並進入機器學習競賽
如何呈現你的發現並讓你的老闆印象深刻
如何為你的分析清理並準備你的資料
K 最近鄰( K Nearest Neighbours )
支援向量機( Vector Machines )
迴歸分析( Linear Regression/Polynomial Regression )
如何運用 Hadoop、Apache Spark、Kafka 和 Apache Flink
如何用 Conda、MiniConda 和Jupyter Notebooks 設定你的環境
配合 Google Colab 採用 GPUs
https://softnshare.com/complete-machine-learning-and-data-science-zero-to-mastery/
kaggle 在 我要做富翁 Youtube 的最佳貼文
1) Chris生意創業分享會+試堂:https://edu.money-tab.com/chris-sharing
2) 《我要做富翁》網上版登入/APP下載:http://onelink.to/mtapp
3) 緊貼我們社交平台,不錯過任何免費分析/教學:
訂閱YouTube頻道: https://youtube.com/channel/UCdWNwPuaS1o2dIzugNMXWtw?sub_confirmation=1
讚好Facebook專頁:https://facebook.com/203349819681082
==============================
人工智能介別的世界大戰已經開始!不論你會否進入此行業,但今集 #我要做生意 會同大家預言一下未來走勢,當科技不斷進步時你應如何作最好的準備跟上世界的步伐?假若你也遇上創業或做生意的任何問題,務必留言告訴我們,以及記得按個Like及Tag朋友一起來收看吧 :)
kaggle 在 如何利用Kaggle 從資料科學新手到專家#補根知識 018 的美食出口停車場
補根課程 #資料科學#Kaggle想多多增進資料科學的實作經驗嗎?補根知識第十八集為您介紹邁向資料科 ... ... <看更多>
kaggle 在 Kaggle - 首頁 的美食出口停車場
michau96's notebook "Education Level Affects Data Analysis" explores the Kaggle ML & DS Survey dataset while paying special attention to the educational ... ... <看更多>
kaggle 在 [討論] ML/AI 工程師需要的數學- 看板Soft_Job - 批踢踢實業坊 的美食出口停車場
我換個標題比較方便未來有人需要的話可以搜尋。
我來拋磚引玉一下台灣業界現況。
我個人 112 CSIE 碩畢,但碩論跟 ML 無關,沒有 ML 相關的學術論文。
Kaggle 銅牌以上 x 5 (兩次是抱團靠隊友)
六年工作經驗,算是 deep learning 熱潮起來以前就入行。
待過兩家五百人規模的新創,工作內容包含將商業問題轉換成
ML 可解的問題、將解出來的模型跟系統組的同事合作推上線
有時候也要接一下資料(水管)。
先講工作上會用到的數學:
一些基本的統計觀念,對於觀察資料會有幫助。
理解使用到的 ML 模型的概念,了解這個有時候會對參數選擇有所幫助。
Deep learning 的話至少看得懂 loss function,有時候會把不同 loss
合起來一起訓練。少數幾次遇到的問題沒有合適的現成 loss ,所以自己
亂寫 loss function,寫完也是丟給 tf 幫我 optimize。
理解使用到的 metric,關乎到你怎麼挑選模型跟 loss function。
我覺得理解 metric 跟 loss 是很重要的,這樣模型在 metric 表現不好
的時候才知道要往哪個方向調整。
看 paper 我第一個看它實驗怎麼做的、結果怎樣,看完覺得有機會在我的
dataset 上也夠好才會繼續看,第二個看有沒有現成的 code 可以用,第三
個才是去理解它的方法 (通常是 loss function)。至於裡面的定理,很多
假設都跟現實有差距或是它是在證 error bound 這種我知道也不能幹嘛的
東西。至於正確性就相信 reviewer 不會偷懶 XD 所以通常都是跳過不看 XD
工作上最需要的就是做的東西要有商業價值,至於後面是什麼技術、數學
多難本身不是太重要,跟不懂的人講什麼模型聽起來都很厲害。如果 rule
based 的方法成效就足夠好,我也會先用它頂著。當然一般來說 ML 的成效
都會比 rule based 更好,所以用到 rule based 的機會還是很少。
數學重要在幫助你選擇適合的 metric 跟模型,以及調模型的時候更有效率
,可以不用所有的參數丟下去跑,畢竟這個花時間也花錢,對公司來說這兩
個都是大成本。
以這個需求來說,我覺得不需要很艱深的數學,主要是機率統計微分(沒有積分)
,如果你說矩陣相乘算線代那有用到,再難的就很少了。
重要的是觀念要清楚,用到的都是觀念。
最後,工程師 coding 就是基本功,所有的想法都要 coding 才能在真實世
界實現,尤其 ML 常常處理大資料,模型也要上 production。我不知道 ML
要強到什麼程度公司才願意配一個人專門幫你寫扣 XD
我的經驗是架構方面通常會有專業的同事幫忙設計,inference 的部分就要
自己寫。data pipeline 的話同事會將資料整理好,可能是 parquet on s3
,把它轉成 feature 到 model training 再將 model 送上 production 機
器這一段要自己寫。
實驗 code 就是全部自己來,code 有沒有效率就關乎你實驗跑多久、能跑多
大的 scale。
關於面試,六年來我也應該面過二十幾個 ML engineer 的職缺,大小公司都
有,台灣日本新加坡都有。我自己在兩家公司也都有幫忙面過 ML engineer。
通常 ML 面試就是給你一個問題,問你怎麼用 ML 解。比如說怎麼設計推薦系
統之類的,然後再從你的回答問延伸問題。我覺得只要大觀念會、對於提出來
解決問題用的模型有一定程度的理解就可以了。我從來沒有被問過任何證明推
導的問題。Research scientist 我就沒面過了,不清楚。
除了少數幾家小公司沒有問 coding,其他幾乎都有,而且我體感規模越大的公
司問的越難,所以 leetcode 還是要刷,越大間的公司越要刷。
前陣子剛好敝公司比較多 ML 的 headcount,所以我幫忙面了大概有十個人吧,
最後錄取三個。我參與的是第二輪面試,所以我不知道第一輪是怎麼挑人的。我
們主要想找有 NLP 經驗的人,我看到的履歷沒人有頂會,只有一個有 Kaggle
成績,一個是碩班做 NLP,其他都是因為相關工作經驗被找來。進來以後我覺得
工作能力上也沒有什麼問題,對公司也能有商業上的貢獻。
我自己面試人對於 ML 的基本要求是,知不知道用的模型概念是什麼、哪些參數
是重要的、能不能根據問題挑選合適的 metric 以及根據這個 metric 挑選合適
的模型,怎麼判斷模型好壞、成效不好的怎麼 debug 跟調整。
以上跟有沒有頂會完全無關,當然發過頂會的人對於上面這些問題一定是都能答
得不錯,但沒發過頂會也可以。反而因為上面這些問題很重要,我個人是很看重
Kaggle 的,Kaggle 除了 metric 幫你決定好以外,其他能力都要好才能有好成
績。Kaggle 我只認可有獎金的比賽成績,銅牌以上我覺得應該就有基本能力可以
找來面試看看,銀牌以上應該程度不錯,金牌我會覺得很強。
Kaggle 當然 deep learning 相關的比賽有設備有優勢,不過也是有人靠免費的
colab 拿到金牌,如果只要求銅牌的話對於拿免費的 colab 頂著用也不是每個比
賽都跑不完,有時候 google 也會贊助 300USD 讓你用 GCP,我覺得不求頂尖成
績的話設備不會是問題。
會找來面試的通常是有相關工作經驗,或是碩班做 ML,或是有 Kaggle 成績。
轉領域的話前兩項一定是沒有的,就去 Kaggle 刷一個銅牌吧!刷不到至少也知
道 ML 是怎麼回事,有沒有興趣做下去,探索興趣對人生來說也是很重要的事情
。我覺得刷 Kaggle 很好玩呀,只是太花時間了,不然我也想天天刷 XD
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 59.104.122.246 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1636769550.A.E5D.html
※ 編輯: jigfopsda (59.104.122.246 臺灣), 11/13/2021 10:14:03
具體面試流程每家公司都不太一樣,技術面試之前應該都有機會可以問 HR 該公司
是怎麼安排的。也是有可能同一關一半的時間考程式一半的時間問 ML 相關經驗或問題
... <看更多>