資料工作者可能的第一本書 -- 蘋果橘子經濟學

Apr 18 2018

蘋果橘子經濟學(Freakonomics)被寫出來時,兩位作者可能還不曉得資料科學家是啥。 大概也沒想過,他們的這一本書,在 10 年後,是有機會成為資料工作者的第一本書。 一本一開始就想要顛覆你(想投入資料工作者行列的人)對資料怎麼看待的角度與觀點的書。 喔,對了!它除了有點怪誕以外,還挺詼諧的,是一本搭高鐵時可以看(完)的書。

書裏頭提到的一些問題討論與論述中,印象中很深刻的,列舉個幾點:

  • 真正降低美國犯罪率的,可能是墮胎合法化的推動?!
  • 誰說只有學生會作弊,美國小學老師可能會帶頭作弊?!
  • 專業的房屋仲介,想的可不是幫你以更好的房價賣出?!
  • 我們都知道父母希望小孩贏在起跑點是天性,但虎媽虎爸,也許沒你想像中的那麼幫助小孩?!

怎麼會有人把犯罪率的降低與墮胎合法化給牽聯在一塊兒呢? 而且更驚人的是,原來小學老師也是會在學生的成績上作弊的,而且還是有點驚人的作法。 然後呢,如果你是教育部會的長官,你又要怎麼抓出這些帶頭作弊的老師們呢? 另外還有,像是前一陣子不是流行虎媽虎爸嗎?但這本書裏頭單確想提出,在某些方面, 父母對於小孩未來的發展的影響力,是與平常認知有一些差距的。 像是書籍裏頭提到「常常唸書給小孩聽」與「小孩未來的發展」,可以說是幾乎沒有幫助的!

Read On →

有這 14 項特質的女人,要努力把握住

Apr 14 2018

最近瞄到一篇有點意思的文章, If a woman has these 14 qualities never let her go, scientists say。 簡要記錄一下。

  1. She is smarter than you
  2. She is honest
  3. She has a positive outlook
  4. She compromises
  5. She laughs at your jokes
  6. She has an open heart
  7. She supports your goals and pursues her own
  8. She has a good relationship with her parents
  9. She is kind
  10. She remains calm in fights and calms you down too
  11. She does foolish things with you
  12. She has a life of her own
  13. She accepts your flaws
  14. She does not bear grudges

目前覺得最困難的,大概就是第 5 點吧 XD

小小體驗一下 Comet.ml

Apr 9 2018

前幾天有一個新服務 Comet.ml 在 TechCrunch 下了個這樣的標題與介紹:

Comet.ml wants to do for machine learning what GitHub did for code

The service provides you with a dashboard that brings together the code of your machine learning (ML) experiments and their results. In addition, the service also allows you to optimize your models by tweaking the hyperparameters of your experiments. As you train your model, Comet tracks the results and provides you with a graph of your results, but it also tracks your code changes and imports them so that you can later compare all the different aspects of the various versions of your experiments.

大意是說,這個 Comet.ml 的服務,是被開發來給資料科學家用的服務。 它就像 GitHub 是給 developer 用的一樣,扮演著類似的功能,只是是特別對 model training 做一些特化。 所以它會把每次的建立模型的 1) 程式碼; 2) 參數; 3) 設計的模型; 4) 安裝了什麼 Python packages; 5) 模型練習的過程/成效/結果; 6) stdout; 7) 其它文字註解… 這幾項給通通存起來,方便日後回來校閱或比對。 更方便讓幾位資料科學家或演算法開發的工程師可以一起研究,有個依據。

一言以蔽之, 它是一個用來 紀錄 / 追蹤 / 比對 一個模型設計與開發的服務。

感覺挺有趣的,決定來試試看。 本著上次在公司裏頭鐵頭的 Data Team Workshop 的一些些印象, 加上它又有 repo,而且還是友善到不行的手把手 notebooks 型式, 很有機會可以拿來試驗一下這個 Comet.ml,即使我至今還沒完整看過 Tensorflow 或是 Keras 的文件或教學影片!

看來看去,就拿裏頭的 MNIST 來試好了。

用最簡單的兩個 Dense (Just your regular densely-connected NN layer) 做一個 model, 第一個 layer 的 output vector size 用 64, 第二個(最後一個) layer 的 output vector size 則是 10,設成與 MNIST 要分類的個數一樣。 丟下去跑一跑,在 Comet.ml 上跑出了這麼一個 Experiment

在 Comet.ml 上頭,每一次的實驗,就叫一個 Experiment。 透過它 monkey patched 過後的 Keras, 一旦你開始執行你的程式做 training, 它就會開始自動紀錄你 model training 的整個過程, 它會自動幫你把每次 training step 的 (loss, accuracy) 給記下來, 然後最後(按官方文件的說法)自動上傳到 Comet.ml 平台。 也可以再自行加上呼叫幾個 log function 來特意把一些想記的參數給上傳上去。 這個是我第一次的 experiment 的程式碼

相當的有意思,忍不住多把玩了幾下。 (結果就是睡到半夜四點醒來,還多下了一個 experiment XD)

Read On →

做菜 Perfect Vegetables

Apr 7 2018

有一種「做菜」,不是媽媽在廚房準備著美味佳餚的行為,
而是市場販賣端將菜「做」成消費者想要的樣貌…

by 做菜 Perfect Vegetables

「做菜」,是一部拍得很有意思的短片。看起來是 2017 年的作品,有在公視上映。 算是紀錄片類型,屬於現代人可以忍耐的影片長度,探討著一個台灣文化風情的某個現況。 影片,大概是這麼個方式開場的:

在一次的台北聚會後,影片拍攝團隊成員之一的 Moly Mo 注意到了一個現象。 他發現聚餐結束後,有不少還未完食的菜色。 但大家礙於面子問題,並沒有讓這些菜餚被打包起來。 加上大家也吃不下了,於是這些菜餚,可能就這樣被丟棄了。 Moly 把這個觀察給 po 上了臉書,得到了很多一樣有在關注食物浪費議題的回應, 於是,有了這麼一部紀實片。

從了解食物的生態系統開始,先後接觸了 食物銀行、 老人供餐、 果菜批發市場、 各大超市、 食材產地…等。

原來,政府為了改善農業產品的運銷效率, 農糧署有協定出一套蔬果品質包裝規則標準。 蔬果的分級包裝,滿足著不同的人們需求,也讓果菜農有機會獲得一些議價空間。

絲瓜,特等。

絲瓜,優等。

絲瓜,良等。

這讓我想起了 2016 年時跟著跑去宜蘭體驗種菜的那半年。 那時候我們拿到的絲瓜,因為是阿伯帶著我們自種的(當然還有很多人的照顧), 它是什麼等級這點,根本從來沒有在腦海裏出現過, 因為我們從來沒想過這麼一點點的絲瓜與獲利求生之間的關係, 我們只想著它是自種、無農藥、有機、阿伯帶著我們一點一滴的耕種、…。

吃進嘴裏的絲瓜,不管它生前(?)的樣貌如何,都一樣美味好吃 :D

果菜市場一天疏菜進貨量 11530 公斤
做掉 13
11530 公斤 x 13 = 3921 公斤
3921 公斤 / 台灣人一天葉菜配給量 102 公克
每天浪費 38,000 人葉菜攝取量!

by 做菜 Perfect Vegetables

影片拍攝到的這一段有點諷刺:

大媽/大伯這麼說著: 台北人就是不怕農藥, 毒不死呀! 你不知道喔! 那個菜只要有一點蟲咬到,就不吃了。 其實那種的,才是最安全的。

Read On →

拉麵之神,巧遇

Apr 1 2018

把一種技藝做到花開蝶舞般自然天成,世上無人能模仿、無人能超越,可以稱為「神」。

擁有神技,不私藏、不私傳,秘方任人取用,那是「神中之神」。

拉麵的神中之神

郝廣才先生是這麼形容山岸一雄先生的。

和一般人(不)一樣,平常的上班時間,我是不太在意吃什麼的,不管是早餐還是午餐, 只要大致健康,衛生乾淨,能提供飽足感,就是我的一頓飯。 所以要我吃個一兩個月一模一樣的饅頭夾蛋當早餐,是可以的。 或者更精確的說,是不討厭的。

這種懶人不動腦的飲食習慣,出差時其實也適用。 出差到東京時,由於早上下午都有滿滿的會議要開或準備, 加上又常常到最後一刻都還在調整腦袋裏的東西, 所以方便又迅速的丼飯、炸豬排、炸天婦羅…等,就是我最常吃的出差間飲食了。 喔,對了,忘了還有一樣,那就是拉麵(蕎麥麵/烏龍麵/沾麵)。

有天,很意外的在電視上看到拉麵之神, 講述一位發明了沾麵的先生, 他是如何的堅守崗位在煮麵賣麵這擋子事, 無私的分享他的祕方給別人, 完全不介意別人使用與他一模一樣招牌開的麵店, 一直到最後…

在最近的一次東京出差,意外發現到就在開會的辦公室旁,在一個不太起眼的角落, 開著這麼一家「大勝軒」,主打著山岸一雄最後的弟子所開的店, 我就這麼推了門進去吃了。 邊吃的當下,邊想到一些紀錄片的片斷,有種不可思議感。 距離看到這一部紀錄片的時間,應該不到一個月吧,有種不真實感,但吃在嘴裏的麵條倒是貨真價實的!

對了,山岸先生是在 2015 年 4 月 1 日去逝的,剛好就是完完整整的三年前。 如果你有機會經過涉谷,推薦去吃吃看大勝軒,感受一點職人的堅持。 如果你想看到這部紀錄片,可以試試 CNEX 看看,也許運氣好,就看到了 :)

約莫 20 年人的對智慧手機與個資的預言~

Mar 31 2018

2007 年,蘋果電腦向我們介紹了一款,(再次)影響了整個世界的產品:iPhone。 它原來只是一隻有著觸控螢幕、App Store 以及日後變出來的成千上萬的 apps 的“手機“。 它的出現,的確大大改變了整個世界,但這一篇的重點不是它 ;p

但是就在距今差不多 20 年前,有一位先生就已經在一本雜誌上頭,預言了智慧手機的出現。 更驚人的是,他還預言了它的大小、功能甚至是硬體規格。

I’ve got a cell phone, a pocket organizer, a beeper, a calculator, a digital camera, a pocket tape recorder, a music player and somewhere around here, I used to have a color television, … It will be a box less than an inch thick and smaller than a deck of cards.

最讓我感到不可思議的是,在他那麼短短只有一頁的篇幅裏頭,用以下面這麼一段來收尾:

I call this device a Personal Information Telecommunications Agent, or Pita for short. The acronym also can stand for Pain In The Ass, which it is equally likely to be, because having all that connectivity is going to destroy what’s left of everyone’s privacy.”

他直接預言了未來的人類將會因為這麼一隻小小的智慧手機而失去個人隱私, 而這個世界也的確就是這麼進行著! 看看最近 Cambridge Analytica 讓 Facebook 被搞得多麼的灰頭土臉的, 不正是個資問題嗎!

這位專欄作家同時也是一位科幻小說家, 雨果獎及星雲獎同時得獎者之一我的火星小孩這部電影就是根據他的小說翻拍的。 喔,對了!他還擔任過 Star Trek 其中一集的編劇過。 他叫 David Gerrold

從一位嘗試建置個人用 podcast 的工程師談起…

Feb 19 2018

某一天,一位工程師決定多“讀“點書。 於是他參加了一個訂閱制服務。 付了費,每週都有說書人導讀幾本書, 用瀏覽器上網就能“看“到這些影片。 過了一陣子,他想說,也是可以好好利用上班搭公車的時間。 於是他在想,是不是可以把那些用“看“的影片,轉成用“聽“的? 手機配合耳機,在短短不到半個小時的上班公車途中,感覺至少可以“聽“個一本書,挺不賴似的!

研究來研究去,分析東來分析西,幾天又過去了。 終於,他大概歸納了一下他的需求與目標:

  1. 找個方式把付費的那些影片,抓下來存放在自己的電腦,然後再把它們轉成音檔格式。
  2. 再找個方式把音檔放進手邊的 iPhone。如果能把音檔變成一個 podcast 節目的話,似乎更好!
  3. 希望音檔愈小愈好,這樣就可以不用顧慮網路流量或是手機的記憶體大小。但至少也要聽得清楚說書人的聲音。
  4. 希望可以盡可能的自動化。因為影片每週都會推陳出新,希望 podcast 的節目也能(半)自動跟著更新。

於是他開始了他的計畫,以工程師的方式去執行。

首先,感謝這個付費影音服務很不嚴謹。 可以是礙於預算與技術考量,或是想要試水溫,覺得不需要太在意很多細節。 它的網站雖然要經過付費並且登入才看得到,而且影片的存取,也有小小的保護一下。 但對於一位工程師來說,全球資訊網(WWW)是個非常公開與開放的架構, 只有小小的保護等於是沒有保護。 只花了一下子,他就把影片們都通通抓下來了。 第一個任務搞定!

接著,他上網研究了一下 podcast,大概看個幾個小時,就自稱他懂了。 非常的快,就真的只是幾個小時,就懂了! 但真要他介紹一下,又吱吱唔唔好一陣子。 最後,他想說,不然這樣好了,我去找個現成的軟體,先透過手工操作,弄個 podcast 出來再說如何? 於是大家就通過了,也沒有人再去在意他是不是真的懂 podcast。 事實上,沒有人在乎 podcast 的細節需要懂多少。

初試啼聲:Feeder

他試了蘋果電腦上的一套叫 Feeder 的軟體,很厲害的樣子。 很快的,他就用 Feeder 生出了一個 podcast 需要的 RSS 2.0 feed 出來。 把這個 podcast feed 連同兩三個轉好的音檔,上傳到一個網路上的個人空間。 接著他試著用 iOS 原生的 Podcast app 去開這個 podcast feed, 一切順利,直接就可以播放,還可以上一篇下一篇順利的操作著。

It just works!

Read On →

部落格平台,真的有差

Feb 10 2018

2015.09,寫了一篇 Let’s try Hugo!,足蹈手舞地認為 Hugo >> Octopress >> Drupal >> something else。 認為使用 Go 寫成的 Hugo,挾持著它的高效能,快速產生靜態網頁,就是最重要的功能之一了。 2017.09 還寫了一篇 Hugo 的一點點使用心得,大力稱讚 Hugo + Bitbucket + Wercker + DigitalOcean 是完全組合。

Hugo 的高速效能與彈性; Bitbucket 的版本控管; Wercker 的自動生成靜態網頁; DigitalOcean 的一個月只要 5 鎂的便宜虛擬主機伺服器。

完美。

一直到我開始認真的以 Medium 作為撰寫與工作有關的 blog 後,才發覺整個搞錯狀況了。 看看下一張的比較圖,左邊是極端到過頭的 Bitbucket editor,右邊是優雅的 Medium editor。 雖然說,這樣的比較有失公平。 我們一樣可以把整個 blog repo 給 clone 下來,然後挑個最優的 markdown editor 來用。 但再怎麼好用的 markdown editor, 還是比不是隨處可寫(iPhone, iPad 也能寫)介面簡單,沒什麼其它功能,只剩下書寫的 Medium。

Life is short, using the right tool to express your experience is important.

歷史上的今天 -- 皮克斯 與 賈伯斯

Feb 3 2018

1986 年 2 月 3 號,經過了長達三個月左右的談判與交涉,喬治·盧卡斯接受了條件。 他與賈伯斯簽了個合約,把他旗下的電影繪圖部門(Film Graphics Division)賣給了賈伯斯。 這個被賣掉的部門,恢復了它原來的名字,以皮克斯(Pixar Animation Studios)之名面世。 這一天起,賈伯斯與皮克斯的故事,開啟了序章…

盧卡斯賣掉的原因很多,小道消息指出,原因之一是他剛剛完成了星際大戰三部曲,有現金流的問題。 原因之二,他當時正好與老婆離婚,需要支付一筆贍養費。 而且據另一個小道消息指出,一開始盧卡斯是不滿意賈伯斯的出價的。 但礙於各種原因,最後接受了。 不然,這個部門將會整個被裁掉,大約 45 位員工會被開除。 如果真的是這樣的下場的話,那我們可能得再晚個幾年才看得到 Pixar’s Toy Story!

Read On →

Giloo x KKStream, round 1

Jan 28 2018

2017.09,在那個平均氣溫 27~32 的盛夏台北,KKStream 辦公室有幾位來自 CNEX 的貴賓。 短短不到的兩個小時,立即的達成了共識: 雙方團隊在一週內,以最有效益的方式,在最小的範圍上,協力合作讓 CNEX × Giloo 紀實影音線上影展 上線。 因著這麼的一個合作會議,在這之後,我們有了個機會認識 Giloo 這個新興服務, 同時以接近第一人稱的角度看著它上線,一路到今天~

Giloo的命名,來自於閩南語「紀錄」的發音。

Giloo 的創立初衷是打造專屬於紀實影像的社群平台。 我們相信紀實影像與說故事的力量,如何從生產、觀看、流通與傳播等各個面向加大力道, 是 Giloo 所有企劃與產品的核心提問。

整個合作的需求與契機,緣由非常簡單:內容保護。

Read On →

下一個 Video Codec 明日之星會是…?

Jan 7 2018

1998 年成立的 Streaming Media,是個專門報導影音串流相關資訊的媒體。 我們過去參加了三屆 Streaming Media West 以及一屆 Streaming Media East,就是這個單位主辦的。 按官方的介紹,Streaming Media (如今)有以下幾個目標:

  1. StreamingMedia.com / 經營 StreamingMedia.com
  2. Exhibitions and conferences / 舉辦國際會議與辦展
  3. Research and publications / 做深入的研究與報導。

Read On →

AlphaGo 紀錄片

Oct 23 2017

同行的 G 說得好,這部電影把前四場的對奕,導演是按「起」「承」「轉」「合」的述事方式鋪陳的。 有一開始李對電腦的輕忽而導致的驚嚇;接著的第二天對戰仍然覺得不可置信;第三盤時 AlphaGo 的神來一手;第四盤的人類大反攻。 電影裏頭,我們將看到不管是韓國棋院、現場的記者、韓國人民或甚至是 DeepMind 的工作人員對於李世乭的不捨而閉聲不語。 即使不懂圍棋,不懂人工智慧,也一樣能感受到整個氛圍的變化。

這是一部,你知道正在看的是一部紀錄片,潛意識會預期它會有點沉悶,因為它反映著某種事實,沒有太多餘的排演。但是,其實它是部戲劇性十足的電影。 這是一部看了絕對不會後悔,不看會錯失人類歷史上重要一刻的電影。 這是一部有 Fei-Fei Li, Eric Schmidt, Sergey Brin 等大人物的電影。 這是一部有血有淚的電影。

如果你剛好有這個機會,推薦去看看 :)

過去,李世乭是為他自己,為他的國家而戰。如今,他是為了整個人類與電腦一戰。

Read On →

好友,圍棋以及 AlphaGo 紀錄片

Oct 21 2017

去年,來自英國 DeepMind 的 AlphaGo 挑戰了世界棋王,而且它真的贏了!讓整個世界關心起了圍棋。 然後就在今年初,在好朋友 Hajin Lee 的文章中得知,有一部講述整個 AlphaGo 與李世乭對奕的紀錄片! 老實說,我並沒有去看 AlphaGo 的那幾場對奕,更沒有像同事(gxx, ixxxxxxd)他們那麼專注研究。 所以像是 Master, AlphaGo Zero 與 AlphaGo 的差別,技術細節,根本上改變了什麼,我還是一知半解。

但是呢!大學時期跟著死黨學圍棋的回憶;最要好的朋友 Dan 娶了一位圍棋職士;Hajin Lee 的文章介紹。 這就讓我好生希望能快點看到這一部電影。非常的希望能在台北的戲院看到! 不然,至少看是 CatchPlay, CNEX 或甚至是 KKTV 也想辦法去爭取個版權嘛~

最後,Hajin 留下了一段對於這部紀錄片很有意思的文字:

If anything could be added, I would include information about the primitive level of top Go A.I.s before AlphaGo, and more about professional Go players’ lives and pride, to provide more context for Lee Sedol’s pre-match confidence, and Go players’ changing perception of AlphaGo as the match advanced.

Ref: