小編到 Funliday 之後就是專注在 POI Bank 的開發,這篇文章出來後,總算可以公布 POI Bank 這個名稱了。年前最後一個工作天把 POI Bank 弄上線真的要有很大的勇氣,過年期間果然被使用者罵很慘,搜尋搜不到、沒有圖片、一堆景點名稱都是羅馬拼音...族繁不及備載。
除夕當天除了吃年夜飯跟打掃家裡以外,全部時間都拿來轉檔跟調整演算法,想辦法讓搜尋更精確,春節期間真的是整個團隊都沒好好過年。但也是這樣的壓力測試,讓 Funliday 可以快速迭代!
不過過完年後看到使用者操作的真實數據後,發現 POI Bank 真的是大有可為,就像文內所舉的其中一例:
「舉個例子,若我們從觀察用戶的數據資料,發現這個假期許多人計畫去某觀光景點,也許就能跟該觀光景點合作,提早讓店主掌握狀況預先處理,提供更好的旅遊品質給民眾。」
其實 POI Bank 能做到的遠遠不只這個,但就讓 Funliday 賣個關子吧 XDDD
---
這裡順便來聊一下搜尋精準度的問題,整整一個月除了上星期小編去東京考察以外,每天都在調整精準度。
這星期回來重新思考跟測試後,發現根本就是斷詞的問題,雖然用了大家都推薦的 jieba 結巴斷詞,但沒用台灣詞庫,斷出來的結果真的是慘不忍睹。
這週二 (2/26) 把用了台灣詞庫的搜尋丟上去之後,情況看來好了很多。因為搜尋精準度太難用程式量化了,所以現在加了 ab testing 上去,每幾天用工人智慧看一下大家的使用狀況後,再持續最佳化下去了。
---
因為沒心力做行銷,Funliday 現在只能口耳相傳,一傳十十傳百,希望沒使用過 Funliday 的朋友看到這篇文章之後,能下載來用用看,對你出門旅遊絕對有很大的幫助,有使用過的朋友,也幫忙多拉幾個朋友來使用。
Android 的共同編輯跟 Web 完整版就快要上線了,希望大家以後多多支持 Funliday 啦!
#funliday #poibank
jieba下載 在 Mina 安米娜 Facebook 的最讚貼文
題目:如果飛機在飛行當中打一個小洞的話 會不會影響飛行的安全呢?
.
選兩個你覺得最有可能的答案
(0)其實狗搖尾巴有很多種方式 高興搖尾巴 生氣也搖尾巴
(1)如果這個洞的話經過仔細的設計的話 應該不至於造成太大問題
(2)所以只要依照政府規定 在採收前十天不要噴灑農藥
(3)靜電才是加油站爆炸的元凶 手機不過是代罪羔羊
(4)我們可以用表面張力及附著力的原理 來測試看看
(5)不過蝦子死亡後 身體會釋放出有毒素的體液 可能造成水的變質
.
答案請直接拉到最後一段
-----------------------------------
其實我每個周一晚上.....
.
都有偷偷參加Machine Learning的線上讀書會(請勿認親XD)
.
加入已經一年多,今天終於有機會當Host了(感動
.
我就分享一下我今天講的
.
搞不好看完你們就想睡了 哈 我也算功德無量
.
主題:【自然語言語意分析;Natural Language Processing】
.
簡單來說,電腦可以理解人類很口語的話,電腦也可以透用人類的語法解釋給人類聽電腦自己的想法(output概念)
.
像是siri功能就是
.
你跟siri講「我明天要7:30起床」跟「早上7:30分叫我」
-->siri都會幫你設早上7:30分的鬧鐘
.
表示 siri她聽得懂你很口語,亂七八糟的,非結構化的語意!!!!!
.
廢話不多說,我們直接來跑程式
.
(0)環境jupyter notebook python 3.6.3
.
(1) 下載一份語料('cna.cbow.cwe_p.tar_g.512d.0.txt')
https://mega.nz/#!5LwDjZia!f77y-eWm90H3akg8mD9CqhOZ89NihirRKN4IT1SJ01Q
.
【圖1】每一個詞都有一個介於0~1的分數,分數越接近表示他們的意思越相近,
像是「柯文哲」可能是0.0000420,「市長」可能是0.0000428;
像是「快樂」可能是0.0000123,「高興」可能是0.0000124
.
(2)下載jieba numpy
語法:
import jieba
import numpy as np
.
(3)把cna.cbow.cwe_p.tar_g.512d.0.txt解析後存成word_vecs物件
.
(4)給電腦題目:"如果飛機在飛行當中打一個小洞的話 會不會影響飛行的安全呢?
.
給電腦6個選項問他哪一個是對的
.
(5) 【圖2】電腦會給六個答案,每個答案都會有一個介於0~1的數字,數字最大的選項,就是電腦的答案!
.
電腦會選:如果這個洞的話經過仔細的設計的話 應該不至於造成太大問(分數0.632分)
.
我們可以用表面張力及附著力的原理 來測試看看(分數0.57分)
.
(6)結論就是: 電腦答對了!! 🤣😃
.
大家晚安
安米娜
#naturallanguageprocessing #NLP
reference
https://www.youtube.com/watch?v=ERibwqs9p38&list=PL3FW7Lu3i5Jsnh1rnUwq_TcylNr7EkRe6&index=2
完整語法在這裡
https://fgc.stpi.narl.org.tw/activity/videoDetail/4b1141305ddf5522015de5479f4701b1
jieba下載 在 Python PTT留言爬蟲留言分析依據字詞頻率製作成文字雲(Word ... 的美食出口停車場
requests: 抓取網頁; BeautifulSoup: 分析網頁; matplotlib: 繪圖並顯示; wordcloud: 將文字生成文字雲; jieba: 文字斷詞工具. 還需要去下載繁體字典 ... ... <看更多>
jieba下載 在 大數據分析語言Python 網路社群文字探勘(Text Mining) 的美食出口停車場
html5 的網頁標籤格式,加以下載。 圖五、程式碼-抓取網路文章文字內容. 圖六、程式碼執行結果(1)(部分文章). 以下程式內容主要是啟動jieba 斷詞模組,將文章中的句子 ... ... <看更多>