這篇是把上面2個方法都說是標準化分別是(Max-Min和Z-Score) 正規化變成One-hot Encoding和Label Encoding 上面2篇的共識就是都說正規化的原文是 ... ... <看更多>
標準化正規化差別 在 標準化規格化、泰勒原則、泰勒主義在PTT/mobile01評價與討論 的美食出口停車場
如題想請問一下標準化和規格化差別在哪你們知道嗎? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 210.66.90.145 ※ 文章網址: ... ... <看更多>
標準化正規化差別 在 標準化規格化、泰勒原則、泰勒主義在PTT/mobile01評價與討論 的美食出口停車場
如題想請問一下標準化和規格化差別在哪你們知道嗎? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 210.66.90.145 ※ 文章網址: ... ... <看更多>
標準化正規化差別 在 [問題]作PCA之前數據要先轉化成常態分布嗎? - 看板Statistics 的美食出口停車場
論文中的數據 是一群青蛙的22個長度特徵測量值
偉大的教授 要我用normal distrubution plot檢查數據
如果不符合常態 就要試試看取log 或是倒數 或是OOXX...
但是我翻多變量分析課本 PCA並沒有要求要常態分布
也沒有看到別人的論文 作PCA之前先轉換數據
但是老闆非常的堅持!!= =
請問板上有人對PCA有經驗嗎?
是大家的數據都是常態嗎?
然後統計學課本也認為是基礎觀念所以沒有提嗎?
--
歹年冬
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.120.240.69
書上說 變數單位不同時 (如身高、體重)
要將covariance matrix(S矩陣) 改為correlation matrix(R矩陣)作標準化
而PCA的目的 是將"多個有相關的變數 簡化成少數幾個相互獨立的變數"
讓受測者顯現出最大的個體差異
如果為了要求常態分布 自己把變數取log或是倒數...
會不會 反而 違反了主成分分析目的(顯現整群的"最大個體差異")呢?
另外書上的其他例子 像是物價指標 (23個城市的五種食物價格)
用normal distrubution plot檢查 PPCC值也沒有達到0.99
另外 多變量課本中的其他分析 像是 判別分析(discriminal analysis)
對於母體是否常態 就有明確的要求
如果主成分也要求常態的話 應該會寫吧??@@
另外 謝謝你推薦的書 我在馬上去書店找找
ps 我用的是 陳順宇的多變量分析
※ 編輯: smartsnake 來自: 140.120.240.69 (05/25 20:36)
... <看更多>