=== 市長市長別生氣,我們一起看數據 ===
看到這張圖出來,完全理解市長替台南委屈而生氣
但身為曾經的數據分析師總是要出來解釋一下
或許會讓看完的各位.....不小心更生氣....
====== 先談這項技術 ======
Google地圖告訴我們哪條路線現在擁擠
是結合各位的手機數量搭配GPS訊號的成果
但是高公局跟中華電信則是細胞定位技術
也就是透過跟三個以上的基地台來回資訊來掌握位置
準度比不上GPS,但也能結合GPS來校正。
基本上1968這套系統就是採用
「中華電信的手機在"哪個範圍內"待了"多少時間"」
「然後以過去三個月的這些範圍來做為發布標準」
.........然後問題就來了!
====== 請問怎麼界定範圍? ======
台南市的「關子嶺」 (僅算關嶺里超過20平方公里)
台北市的「木柵動物園」(面積1.65平方公里)
台北市的「北投市場」(樓地板面積0.01平方公里)
假設這三個地方在這三個月各自來了100萬人
請問哪個地方比較可怕?
當然是「密度高」的那個最可怕!
但這套系統卻沒有告訴你密度這件事情
為什麼?
>>因為這樣做的話,台北可能到處都是紅的。
====== 請問待了多少時間? ======
大概這件事情就又更專業的一點
手機在這個附近待10秒鐘(等紅綠燈)
手機在這個附近待1小時(在風景區這就是出來玩的人)
加上剛剛的範圍
請問哪個比較容易待超過1小時?
雖然這屬於細部的數據調整
或許夜市及菜市場這類只要超過10分鐘就會計算
(參考他們是以每10分鐘更新一次)
今天我想強調的重點是
這些資料如果沒有在同樣的基礎上計算
通常都會有偏誤發生,也就是不小心誤殺好人
====== 但我們還是建議下載1968 ======
防疫期間政府確實也不斷努力
加上各種新的系統不斷推出總是值得鼓勵
但是請好好思考一下
想出門的人流不會因為公布的地點變多而放棄
卻因為擔心的地點變多更加集中在其他區域
導致更加群聚
接下來真正要改善的方向是
>建立「所有」觀光區的密度指數(人/平方公尺)
>建立「所有」人口密集區的平均滯留時間
>重新界定哪些地區是真正的「高、中、低」示警
現在做的東西其實有很高的機率
不是濫殺好人(明明沒有人卻說很多人)
就是放過壞人(明明很多人卻說沒有人)
====
#台南的業者們都很用心配合防疫阿
#請不要隨便濫殺無辜好嗎
#請看看台南精美的31處
#就知道有BUG了阿
#了解數據本質真的很重要阿
#二到四月應該沒有偷偷算到過年這段吧
附上新聞連結:
https://udn.com/news/story/7266/4521555
Search