💥 20 個 #常見的統計錯誤,你犯過,或是犯了卻不知道嗎?⠀
⠀
MedCalc 的作者 Frank,在 Facebook 分享了一篇跟統計相關的文章,叫做「生物醫學研究文章中,連你都可以發現的 20 個統計錯誤」,很有意思。(連結請見原始貼文)
⠀
我(蔡依橙)認真看完後,覺得蠻不錯的,於是把這 20 個統計錯誤的標題翻成中文,協助大家節省時間,如果剛好有興趣的,可再針對該部分去閱讀原文。接著,分享一些我看完之後的想法。
⠀
⠀
1. 數值報告時,提供了不必要的精確。例如 60 公斤體重,硬要寫成 60.18 公斤。
⠀
2. 將連續變項分組,變成次序變項,但沒有說明為什麼這樣分。像是 CRP 不以數值去統計,而分成低、中、高三組,卻沒說明為什麼這樣分。
⠀
3. 配對資料,只報告各組平均,卻沒報告其改變。也就是只報告治療前血壓、治療後血壓,卻沒報告有多少人上升、多少人下降、平均下降多少。
⠀
4. 描述性統計的誤用,尤其該用 median (interquartile range) 的,硬是用成 mean +- SD。
⠀
5. 使用 standard error of the mean (SEM) 描述量測的精確度,而非 95% CI。
⠀
6. 只報告 p 值,卻沒提到差值以及臨床意義。
⠀
7. 誤用統計方式。尤其常見的是混淆有母數跟無母數統計方法。
⠀
8. 使用線性迴歸,卻沒有先確定資料之間是真的有線性關係。
⠀
9. 沒有使用全部的資料,然後又沒把去掉的資料「為什麼被去掉」說清楚。
⠀
10. 多組比較的 p 值校正問題。
⠀
11. 在隨機分組研究時,過於詳盡地比較了兩組受試者的基本資料,像是性別比例、年齡、體重、血壓等等,而且資料好得太奇怪。
⠀
12. 報告檢驗數值時,沒有定義 normal 與 abnormal。
⠀
13. 計算 sensitivity 與 specificity 時,沒有說明一些介在灰色地帶的檢查結果,如何呈現與去除。
⠀
14. 使用圖片與表格,只是為了儲存數據,而非以協助讀者理解為出發點。
⠀
15. 畫出來的數據圖,視覺主觀上給人的印象,竟然跟數據本身不同。
⠀
16. 在報告數據與解讀時,搞不清楚 units of observation 是什麼,例如心臟病的觀察研究,在 1000 個患者中有 18 位心臟病發,那 units of observation 就是 18。但如果這個研究是以診斷正確率為主,那 sample size 就是 1000。
⠀
17. 把不顯著的統計,或 low power,解讀成 negative,而非 inconclusive。
⠀
18. 分不清楚解釋性研究與實務性研究,前者為 explanatory / efficacy / laboratory,後者為 pragmatic / effectiveness / real world。嘗試兩種混著做,結果兩邊都做不好。
⠀
19. 沒有用臨床能理解的方式來報告最終結果。
⠀
20. 把統計的顯著性,當成臨床的重要性。例如:癌症用新藥治療,統計上很顯著的好,但追蹤了五年,患者只延長了七天的壽命。這就是統計有顯著,但臨床意義不大的例子。
⠀
⠀
🗨 我(蔡依橙)的一些想法
⠀
由統計專業人的角度,來看生物醫學發表,是很有警惕意義的,能讓準備發表的朋友,仔細看看自己是不是也犯了相關的錯誤。
⠀
但另一個角度看,作者也提到,這些錯誤在幾乎一半的生物醫學論文上反覆出現!這就代表,其實生物醫學論文要刊登,並不代表我們什麼錯都不能犯,相反地,這 20 個錯誤裡頭,有些就算犯了,也還是能被刊登。
⠀
以我們自己發表,以及過去協助同學的經驗來說,我會認為 2、7、10、14、15,是初學者也 #必須理解並避開的,其他的則是發表起步了之後,陸陸續續去注意,在往更高分期刊挑戰時,逐漸進步就行。
⠀
實務上,3 分以下的醫學期刊,幾乎沒有專門的統計查核,你只要能通過「一般同行」的統計知識審查就行。也就是說,我是一個放射科醫師,剛開始起步,投稿到放射科 3 分以下期刊,文章中的統計,只要「#一般有在做研究的放射科醫師」覺得可以就行,不見得要到「統計專家看過並挑不出毛病」。
⠀
對於初學者如何起步,實務的協助,新思惟規劃了各種類型的研究課程,歡迎有興趣的朋友可以參考。目前正在開放報名中的,有以下三場工作坊,歡迎您瞭解各課程的課綱後,評估挑選最符合您需求的內容,前來上課,讓我們協助您成功起步。
⠀
🟠 2021 / 11 / 7(日)統合分析工作坊
無經費、資源少也能發表,不用 IRB 且免收案的好選擇。
https://meta-analysis.innovarad.tw/event/
⠀
🔵 2021 / 10 / 17(日)臨床研究與發表工作坊
全新改款!跟著國際學者走,讓你寫作投稿都上手。
https://clip2014.innovarad.tw/event/
⠀
🟢 2021 / 10 / 16(六)個案報告、技術發表與文獻回顧工作坊
把臨床上的各種想法,在 PubMed 化作專業生涯上的里程碑。
https://casereport.innovarad.tw/event/
⠀ ⠀
不只是說說而已,我們會舉實例,說明其意義、如何避開,在互動實作過程,實際由各位在自己的電腦上操作,從數據到軟體,從統計到繪圖,一次搞定,並避開常見錯誤,是真正以 #初學者起步 為核心的規劃。
⠀
⠀
二十個常見的統計錯誤,與實務寫作時的考量。
🔗 原始貼文 │ https://bit.ly/2WESphu
同時也有2部Youtube影片,追蹤數超過8萬的網紅賭Sir【杜氏數學】HermanToMath,也在其Youtube影片中提到,?賭Sir 幫你急救 DSE 數學: http://www.HermanToMath.com ---------- ?️賭Sir是杜氏數學Herman To Math的始創人 ?全港唯一「完爆」【DSE Core+M1+M2】、【IAL 12科Maths】、【AL Pure+Applied】、【CE...
sd統計 在 新思惟國際 Facebook 的最佳解答
💥 20 個 #常見的統計錯誤,你犯過,或是犯了卻不知道嗎?⠀
⠀
MedCalc 的作者 Frank,在 Facebook 分享了一篇跟統計相關的文章,叫做「生物醫學研究文章中,連你都可以發現的 20 個統計錯誤」,很有意思。(連結請見原始貼文)
⠀
我(蔡依橙)認真看完後,覺得蠻不錯的,於是把這 20 個統計錯誤的標題翻成中文,協助大家節省時間,如果剛好有興趣的,可再針對該部分去閱讀原文。接著,分享一些我看完之後的想法。
⠀
⠀
1. 數值報告時,提供了不必要的精確。例如 60 公斤體重,硬要寫成 60.18 公斤。
⠀
2. 將連續變項分組,變成次序變項,但沒有說明為什麼這樣分。像是 CRP 不以數值去統計,而分成低、中、高三組,卻沒說明為什麼這樣分。
⠀
3. 配對資料,只報告各組平均,卻沒報告其改變。也就是只報告治療前血壓、治療後血壓,卻沒報告有多少人上升、多少人下降、平均下降多少。
⠀
4. 描述性統計的誤用,尤其該用 median (interquartile range) 的,硬是用成 mean +- SD。
⠀
5. 使用 standard error of the mean (SEM) 描述量測的精確度,而非 95% CI。
⠀
6. 只報告 p 值,卻沒提到差值以及臨床意義。
⠀
7. 誤用統計方式。尤其常見的是混淆有母數跟無母數統計方法。
⠀
8. 使用線性迴歸,卻沒有先確定資料之間是真的有線性關係。
⠀
9. 沒有使用全部的資料,然後又沒把去掉的資料「為什麼被去掉」說清楚。
⠀
10. 多組比較的 p 值校正問題。
⠀
11. 在隨機分組研究時,過於詳盡地比較了兩組受試者的基本資料,像是性別比例、年齡、體重、血壓等等,而且資料好得太奇怪。
⠀
12. 報告檢驗數值時,沒有定義 normal 與 abnormal。
⠀
13. 計算 sensitivity 與 specificity 時,沒有說明一些介在灰色地帶的檢查結果,如何呈現與去除。
⠀
14. 使用圖片與表格,只是為了儲存數據,而非以協助讀者理解為出發點。
⠀
15. 畫出來的數據圖,視覺主觀上給人的印象,竟然跟數據本身不同。
⠀
16. 在報告數據與解讀時,搞不清楚 units of observation 是什麼,例如心臟病的觀察研究,在 1000 個患者中有 18 位心臟病發,那 units of observation 就是 18。但如果這個研究是以診斷正確率為主,那 sample size 就是 1000。
⠀
17. 把不顯著的統計,或 low power,解讀成 negative,而非 inconclusive。
⠀
18. 分不清楚解釋性研究與實務性研究,前者為 explanatory / efficacy / laboratory,後者為 pragmatic / effectiveness / real world。嘗試兩種混著做,結果兩邊都做不好。
⠀
19. 沒有用臨床能理解的方式來報告最終結果。
⠀
20. 把統計的顯著性,當成臨床的重要性。例如:癌症用新藥治療,統計上很顯著的好,但追蹤了五年,患者只延長了七天的壽命。這就是統計有顯著,但臨床意義不大的例子。
⠀
⠀
🗨 我(蔡依橙)的一些想法
⠀
由統計專業人的角度,來看生物醫學發表,是很有警惕意義的,能讓準備發表的朋友,仔細看看自己是不是也犯了相關的錯誤。
⠀
但另一個角度看,作者也提到,這些錯誤在幾乎一半的生物醫學論文上反覆出現!這就代表,其實生物醫學論文要刊登,並不代表我們什麼錯都不能犯,相反地,這 20 個錯誤裡頭,有些就算犯了,也還是能被刊登。
⠀
以我們自己發表,以及過去協助同學的經驗來說,我會認為 2、7、10、14、15,是初學者也 #必須理解並避開的,其他的則是發表起步了之後,陸陸續續去注意,在往更高分期刊挑戰時,逐漸進步就行。
⠀
實務上,3 分以下的醫學期刊,幾乎沒有專門的統計查核,你只要能通過「一般同行」的統計知識審查就行。也就是說,我是一個放射科醫師,剛開始起步,投稿到放射科 3 分以下期刊,文章中的統計,只要「#一般有在做研究的放射科醫師」覺得可以就行,不見得要到「統計專家看過並挑不出毛病」。
⠀
對於初學者如何起步,實務的協助,新思惟規劃了各種類型的研究課程,歡迎有興趣的朋友可以參考。目前正在開放報名中的,有以下三場工作坊,歡迎您瞭解各課程的課綱後,評估挑選最符合您需求的內容,前來上課,讓我們協助您成功起步。
⠀
🟠 2021 / 11 / 7(日)統合分析工作坊
無經費、資源少也能發表,不用 IRB 且免收案的好選擇。
https://meta-analysis.innovarad.tw/event/
⠀
🔵 2021 / 10 / 17(日)臨床研究與發表工作坊
全新改款!跟著國際學者走,讓你寫作投稿都上手。
https://clip2014.innovarad.tw/event/
⠀
🟢 2021 / 10 / 16(六)個案報告、技術發表與文獻回顧工作坊
把臨床上的各種想法,在 PubMed 化作專業生涯上的里程碑。
https://casereport.innovarad.tw/event/
⠀ ⠀
不只是說說而已,我們會舉實例,說明其意義、如何避開,在互動實作過程,實際由各位在自己的電腦上操作,從數據到軟體,從統計到繪圖,一次搞定,並避開常見錯誤,是真正以 #初學者起步 為核心的規劃。
⠀
⠀
二十個常見的統計錯誤,與實務寫作時的考量。
🔗 原始貼文 │ https://bit.ly/2WESphu
sd統計 在 Facebook 的最讚貼文
金牌很美,銀牌銅牌一樣美,所以來分享獎牌製造影片。日前看了SD一篇日本獎牌設計說明(放在文末),後來我看東京奧運YouTube 官方頻道,發現他們兩年前就釋出獎牌的製作影片,因為好奇製造來源,所以再去考古。影片很好看,希望大家看看後,再來看這篇文也可以。
東京奧運、殘障奧運預計需要5000個獎牌,金、銀、銅等金屬原料需求量高,因此環境省發起「從都市礦山開始做吧!大家的獎牌Project」(都市鉱山からつくる!みんなのメダルプロジェクト),計畫回收現代都市中產生的電子廢料,如手機、電腦、遊戲機、小型家電等。
自2017年4月到2019年3月,長達兩年的全國性回收計畫,希望能從電子廢料提煉出可循環利用的貴金屬,百分百使用在獎牌製作。人民使用完畢的資源,可轉換為價值再生的循環經濟體系,降低環境傷害,廣義層面來說,這也是第一次由日本全國人民一起參與製作的獎牌。
全日本高達九成的都市鄉鎮參與回收計畫,最後回收量統計約78,985噸,電信業者回收廢棄手機約621萬台,最後確保可用金屬量為「金:約32kg、銀:約3,500kg、銅:約2,200kg」。
獎牌製作委由過去也製造過日本大型賽事獎牌的獨立行政法人造幣局(隸屬於日本財務省,關於造幣局可上wiki查)。所有參與製造獎牌的團隊總共二十人,打造奧運獎牌的工時纖細漫長,一日八小時、四人一組團隊作業,大概只能有15-20個產量,畢竟,事關國家與個人榮譽的每面獎牌,都必須維持一樣的鑄造品質,尺寸、重量、紋路,都不能有任何瑕疵。
製作團隊專業技師說:「製作第1枚和第5000枚獎牌,壓製後光澤度是不同的,為了使它們具有相同的光澤度,特別使用噴製玻璃珠的機器噴砂讓獎牌表面光澤度呈現穩定,而機器的精細微調全靠我們多年培養的技術與直覺,才能做出自己都能接受的成果。」
他們想像,未來看電視時,當選手戴上獎牌,聽著國歌時,他們可以說「啊這面可能是我做出來的呢」。對鑄造團隊而言,獎牌將前往各個國家,也代表了日本鑄造技術將背負的使命,已經他們能參與歷史的榮譽感。
因為武漢肺炎,這些獎牌沈睡了一年。影片中包含設計圖、獎牌鑄造、錦帶製造、木盒製造等,每一個過程,都代表了一雙職人的手。
獎牌設計說明請看此:
2020 東京奧運金牌正式揭曉!100%回收電子廢料製作,如同將石頭打磨出溫暖閃耀的光芒
https://www.shoppingdesign.com.tw/post/view/4414?utm_source=facebook_sd&fbclid=IwAR0pxUQKFVN1CXOCr9eiUqfQmaqt-i5To8AyH6sL7_oLh6xEBkFuHBGOXnk
參考
https://olympics.com/tokyo-2020/ja/games/medals-project/
https://youtu.be/uOo_gFjECIQ
sd統計 在 賭Sir【杜氏數學】HermanToMath Youtube 的精選貼文
?賭Sir 幫你急救 DSE 數學: http://www.HermanToMath.com
----------
?️賭Sir是杜氏數學Herman To Math的始創人
?全港唯一「完爆」【DSE Core+M1+M2】、【IAL 12科Maths】、【AL Pure+Applied】、【CE Maths+A.Maths】的數學導師
?全港第一最多訂閱粉絲的數學教育YouTuber
?YouTube觀看次數超越700萬、訂閱粉絲超過60000人
----------
? Mensa Club member
? 中文大學 數學碩士畢業(Big Data stream)
? 中文大學 風險管理學士畢業
----------
?流行文學作家,出版著作:
《賭馬男人嫁得過》?(2020)
《YouTuber新手到網紅》?(2019、2020再版增訂本)
《5**數學男人嫁得過》?(2019)
《碌葛男人嫁得過》?(2018)
《賭波男人嫁得過》?(2018、同年再版)
----------
?YouTuber Go網絡課程 全港最平+獨家 報讀優惠:
http://hermantomath.blogspot.com/2019/03/youtuber-go-link.html
----------
賭Sir考試戰績:
新制中六DSE: (2016 M2 + 2017 M1)
?數學必修 (Mathematics) 一take過 奪5**
?數學延伸M1 (Calculus and Statistics) 一take過 奪5**
?數學延伸M2 (Algebra and Calculus) 一take過 奪5**
國際高考International Advanced Level: (2017 + 2018)
?Core Math 1 2 一take過 奪A
?Core Math 3 4 一take過 奪A
?Further Pure Math 1 一take過 奪A
?Further Pure Math 2 一take過 奪A
?Further Pure Math 3 一take過 奪A
?Mechanics 1 一take過 奪A
?Mechanics 2 一take過 奪A
?Mechanics 3 一take過 奪A
?Statistics 1 一take過 奪A
?Statistics 2 一take過 奪A
?Statistics 3 一take過 奪A
?Decision Math 1 一take過 奪A
舊制中七高考: (2011)
?純粹數學 (Pure Mathematics) 一take過 奪A
?應用數學 (Applied Mathematics) 一take過 奪A
舊制中五會考: (2009)
?數學 (Mathematics) 一take過 奪A
?附加數學 (Additional Mathematics) 一take過 奪A

sd統計 在 我要做富翁 Youtube 的最讚貼文
本片內容﹕大成交日啟示
大成交日有啟示?
許多時候,不少人都認為成交量是推動買盤或是賣盤的重要力量。如當成交量較大,而資產價格上的時候,代表資產受到追捧,後市的表現將會繼續向上,反之亦然。有些短線投資者 會利用成交額外判斷市場氣氛 而作出投機的決定 當然這個短線投機的舉動,首先風險極大,加上本港可供買賣的衍生工具,存在不公平的條款,筆者並不鼓勵同學仔參與。可是,這些投機者把市場氣氛作量化分析,貌似有根有據。正所謂「知己知彼,百戰百勝」,我們嘗試以數據的測試,了解不同市場參與者的想法。
—測試方法
城間主要利用十天成交額的平均作標準,如當天的金額多於這平均值代表市場出現訊號。當天的走勢將以收市價決定買入還是做空的行動,氣氛向好時買入,較差時便做空﹔而平倉的時間則設於下一個交易日的收市。我們先以近20年來恆生指數作測試。
香港恆生指數
訊號出現次數: 2119
買入和做空成功次數: 1069
命中率: 50.44%
P/L %: 77.26%
近20年來,以這個簡單的策略換來只有僅僅高於5成的命中率,表現中規中舉。而賺蝕方面卻有7成之上,但要留意的兩件事。第一,經過20年的洗禮方可達到7成多的回報,如選用的工具為非槓杵的資產,例如是盈富基金(2800:HK),以20年的機會成本來說表現不算太好。第二,如選用衍生產品作買賣,這必定含有槓桿的成分,以期指15倍槓桿為例,這個策略將有會有超過十倍的回報。可是槓杆包含的風險相信大家都清楚。
有見成功率偏低,我們嘗試把策略改良,買入和做空後兩個交易日後才平倉,結果﹕
香港恆生指數
訊號出現次數: 2119
買入和做空成功次數: 1074
命中率: 50.68%
P/L %: 86.95%
雖然命中率和回報方面有所提升,但效果並不顯著。我們再加入一個統計學的元素,在行動的訊號10天成交量平均值加入一個標準差 (standard deviation),簡稱S.D.。即是平均值只為所有數據的50%,而平均值加上一個SD則為84.1%左右,意思是當成交高於平均的84.1%才出現訊號。
香港恆生指數 (一個交易日後平倉)
訊號出現次數: 882
買入和做空成功次數: 476
命中率: 53.97%
P/L %: 139%
香港恆生指數 (兩個交易日後平倉)
訊號出現次數: 882
買入和做空成功次數: 477
命中率: 54.08%
P/L %: 190.44%
從這個策略的數據可見,命中率雖提升至54%的水平,但依舊處於不穩定的狀況。而回報上,加入標準差使賺錢的能力提高了一倍左右,最高可達近兩倍利潤。
—總結
這個以成交量作交易的策略看似 平平無奇,但卻有其參考價值。筆者經常在提及資產價格一些重要位置時,都表示突破時需要成交量作配合,才可確認市場出現共識,迎接新趨勢。現在的策略雖命中率不高,但回報方面卻有參考性。如我們能組合更多的武器,以技術分析工具和指標找出重要的轉勢位置,配合成交量作最後把關,確認趨勢,回報一定能更進一步。
撰文﹕施宏毅
======================
1) 本月活動,現正接受報名:
新我要做富翁 試堂分享會 (香港站)▶ https://money-tab.info/mts-trial?yt=1
贏在美股試堂分享會(Online)▶ https://money-tab.info/ussjac?yt=1
Jasper 期滙商品分享講座+試堂▶ https://money-tab.info/comjasp?yt=1
Eric Sir期指策略分享講座+試堂▶ https://money-tab.info/futeric?yt=1
King Sir 樓市講座▶ https://money-tab.info/proking?yt=1
齒輪理論 入門班/初班▶ https://edu.money-tab.com/m0m1-reg-c?m0m1=yt
其他活動▶ https://money-tab.info/activity?yt=1
2) 我要做股神APP下載:
iOS▶ https://bit.ly/moneytabapp_i
Android▶ https://bit.ly/moneytabapp_a
升級版▶ https://money-tab.com/membership
3) 緊貼我們社交平台,不錯過任何免費分析/教學:
訂閱YouTube頻道: https://youtube.com/c/我要做富翁?sub_confirmation=1
讚好Facebook專頁:https://facebook.com/203349819681082

sd統計 在 生物統計學:常讓人誤解的標準誤 - Facebook 的美食出口停車場
「先前,老師老師有談到數據的標準差(standard deviation, SD),但是還有人提到標準誤(standard error, SE)。誤與差,我們又常常說誤差誤差,標準差與標準誤這兩者是 ... ... <看更多>