AlphaGo 紀錄片

Oct 23 2017

同行的 G 說得好,這部電影把前四場的對奕,導演是按「起」「承」「轉」「合」的述事方式鋪陳的。 有一開始李對電腦的輕忽而導致的驚嚇;接著的第二天對戰仍然覺得不可置信;第三盤時 AlphaGo 的神來一手;第四盤的人類大反攻。 電影裏頭,我們將看到不管是韓國棋院、現場的記者、韓國人民或甚至是 DeepMind 的工作人員對於李世乭的不捨而閉聲不語。 即使不懂圍棋,不懂人工智慧,也一樣能感受到整個氛圍的變化。

這是一部,你知道正在看的是一部紀錄片,潛意識會預期它會有點沉悶,因為它反映著某種事實,沒有太多餘的排演。但是,其實它是部戲劇性十足的電影。 這是一部看了絕對不會後悔,不看會錯失人類歷史上重要一刻的電影。 這是一部有 Fei-Fei Li, Eric Schmidt, Sergey Brin 等大人物的電影。 這是一部有血有淚的電影。

如果你剛好有這個機會,推薦去看看 :)

過去,李世乭是為他自己,為他的國家而戰。如今,他是為了整個人類與電腦一戰。

Read On →

好友,圍棋以及 AlphaGo 紀錄片

Oct 21 2017

去年,來自英國 DeepMind 的 AlphaGo 挑戰了世界棋王,而且它真的贏了!讓整個世界關心起了圍棋。 然後就在今年初,在好朋友 Hajin Lee 的文章中得知,有一部講述整個 AlphaGo 與李世乭對奕的紀錄片! 老實說,我並沒有去看 AlphaGo 的那幾場對奕,更沒有像同事(gxx, ixxxxxxd)他們那麼專注研究。 所以像是 Master, AlphaGo Zero 與 AlphaGo 的差別,技術細節,根本上改變了什麼,我還是一知半解。

但是呢!大學時期跟著死黨學圍棋的回憶;最要好的朋友 Dan 娶了一位圍棋職士;Hajin Lee 的文章介紹。 這就讓我好生希望能快點看到這一部電影。非常的希望能在台北的戲院看到! 不然,至少看是 CatchPlay, CNEX 或甚至是 KKTV 也想辦法去爭取個版權嘛~

最後,Hajin 留下了一段對於這部紀錄片很有意思的文字:

If anything could be added, I would include information about the primitive level of top Go A.I.s before AlphaGo, and more about professional Go players’ lives and pride, to provide more context for Lee Sedol’s pre-match confidence, and Go players’ changing perception of AlphaGo as the match advanced.

Ref:

Hugo 的一點點使用心得

Sep 26 2017

二年前的這個時候,正式把整個網站從 Octopress 換成 Hugo,簡單記錄一下心得:

  • Hugo 真的很快!感覺其它的 static site generator 應該是很難與它匹敵。
  • 可以選擇的版型還不少,而且大部分都很簡明,版型對容易改。
  • 使用 bitbucket (or github) 搭配 Wercker 來做到自動發佈,真的可以很省事。只要寫好 markdown 檔 push 出去,就可以看到 wercker 上頭執行起相對應的 workflow,然後就是等著成功發佈出去了。
  • 租一台一個月 $5,最便宜的 DigitalOcean 機器來做 static apache hosting 即可。
  • 臨時想寫一篇 blog 的話,直接在 bitbucket (or github) 的網頁上頭,新增一個檔即可完成,連 vim 都不用開。( PS. bitbuket 的 source editor 還 ok )
  • Hugo 的 shortcodes 很好用,而且還可以自己追加或修改,讓產生的 HTML 更自訂化。
  • 可惜 Hugo 無法原生支援 AMP,因為它一篇 blog markdown 只能產生一個 html 出來,就算要 hack 它也有點麻煩。

雖然說,更省事更省錢的方式就是直接把 blog 給放到 github 上頭,但我還是比較希望多一點點自由度,多一點點隱私 :D

台灣資料科學年會 2017,期待的演講者們

Sep 23 2017

台灣資料科學年會 2017 的議程已經放出來幾天了,一直到這兩天才稍為有空瞄一下議程。 在強力擁銷員 陳昇偉博士 的熱情邀約下,KKBOX 集團一口氣貢獻了四個不同面向的主題, 兩個主題與人工智慧相關,另外兩個主題比較偏向資料科學。 搭著有點熟悉又有點陌生的臺鐵電聯車,在帶著幾朵雲的一片藍空下, 做點小功課,先單純的記下幾位講者名單。

似乎第一輪感興趣的講者,教授/學者/教育家居多。挺好的 :)

Read On →

如果 KKBOX Data Game 17.06 是一家 startup 的話…

Jul 7 2017

就如同 Paul Graham 的 Hackers & Painters: Big Ideas from the Computer Age 裏頭說的, 「這是個對科技阿宅最棒的年代,只要夠 nerdy,夠有想法,夠有生意頭腦,那就去創業吧。」

今年五月,KKV (KKStream & KKTV) 內部執行了一個 KKV Data Game 17.05。 隨後的六月,毅然決定對外開放,搭上 PyCon Taiwan 2017 的順風車,辦了個 KKBOX Data Game 17.06。 主辦人之一的 @ironhead 寫了篇 blog:Stories of KKBOX Data Game 17.06。 而這一篇,打算以另一個觀點來聊聊這個 game 到底是怎麼樣的一個 game~

如果,我們把整個 KKBOX Data Game 17.06 當作一家 startup,會是怎麼樣的一回事?

Read On →

關於 KKV Data Game 17.05 的兩三件事

May 23 2017

趨使一件計劃之外的事,產生點意外的火花,最快的方法之一,就是辦一個活動了。

當全世界(好吧,其實只有一小群人)都開始瘋狂談論 AI, Machine Learning 時, 而你發現你們家的基礎建設還很不足, 有很多 data pipeline, data engineering 的事沒做好, 根本無暇去想那個什麼 AI (stuff or buzzwords)之類的… 又或者,雖然你們做了一些 data analytics, 也開發了些所謂的 recommendation system, 但認真想想,其實都還離完全的商業目標有那麼一段距離…

KKStream / KKTV / KKV 很不巧的,剛好也在經歷上述的狀況。 雖然我們有老大哥 KKBOX 可以咨詢,但基本功還是得自己一步一步來。 最最基本也重要的任務:1)組織資料團隊;2)建立資料認知;3)執行資料工程。 都無法假它人之手。

我們在(永遠都會)人仰馬翻的日常業務裏頭,啟動了一個小活動。

KKV Data Game 17.05

  • 人:所有 KKV 集團(KKStream + KKTV 2.0)的同事。
  • 事:根據拿到的,過去一段時間 KKTV 用戶的看劇行為與資料,預測(猜)用戶接下來會看的劇。
  • 時:05/04 - 05/11,僅僅一週。
  • 地:透過 Kaggle in Class 來舉辦整個比賽。
  • 物:使用 KKTV 的真實資料。

Read On →

除了獨到的品味,你還需要能堅持下去的時間

May 12 2017

2015-09-16,寫了一篇 blog – 〝除了獨到的品味,你還需要能堅持下去的時間“。 已經有點忘了時空背景了,不太記得確實的整個來龍去脈。 大約記得,那時候的我離開待了九年的電腦動畫”創業”產業, 剛剛進入 KKBOX Video 部門,一個一直存在於我想像中的網路軟體產業。 說〝一直存在“,也僅僅是因為我一直相信動畫產業與軟體產業是可以互通的,在某種層面上。

在那一篇 blog 裏頭,我分享了 Ira Glass 的一段採訪影片, 影片中,Glass 在分享他個人對於 「創意」「職涯」「初學者」「品味」「專業」「堅持」…的一個看法。 也沒有像前面這一堆字眼那麼的複雜,就是個他的個人發現, 然後以一種溫柔而睿智的方式,簡短的聊了一下~

沒記錯的話,這影片我應該是更早些年就看過了,至少還在太極影音的時候。 那時的我,在熱愛的 Computer Graphics, Computer Science, Computer Animation 遇到不少挫折, 然後偶然間看到一位在地球某個角落的創作者,他分享了這一段影片。 因為這段影片,讓我懂得怎麼面對自己內心的脆弱,撐過挑戰。

影片裏的對白是這麼開始與結束的:

Nobody tells this to people who are beginners. I wish someone had told me. … It’s gonna take a while. It’s normal to take a while. You just gotta fight your way through.

最近,我啟動了一個個人的小小計劃: 每隔一兩週,講個小小故事,分享給同事或家人。 故事可能是我很愛的、影響我的、幫我渡過難關的、我親自經歷過的、我親自實驗過的… 是個「小小傳承」的故事。 說〝小小“,是因為希望它像一則 tweet 那樣優雅, 至少讓人在失去耐心前,可以剛剛好消化完。

而這一則故事,剛好就在上週與 KKStreamers 的週會中提到。


以下是 2015 的原文,因為原影片已經被拿掉,改放上類似的。


我非常喜愛一段短短的,只有約五分鐘長的一段影片,是由 Ira Glass 主持的 This American Life 這個節目中的一段。 內容是 Glass 分享了一段他對於品味與創意之間的關係與觀察。

這個是 YouTube 上頭一個快節奏的文字版。

以下是影片內口白的節錄:

Nobody tells this to people who are beginners. I wish someone had told me. All of us who do creative work, we get into it because we have good taste. But there is this gap. For the first couple years you make stuff, it’s just not that good. It’s trying to be good, it has potential, but it’s not. But your taste, the thing that got you into the game, is still killer. And your taste is why your work disappoints you.

Read On →

Google Cloud Next '17: 玩玩 Vision API

Apr 14 2017

今年三月,急就章的去了一趟 Google Cloud Next ‘17, 重新體驗了一下 Cloud Vision API, 順道玩玩別人拿它來做的小實驗。

這個在現場的 Vison API demo booth, 最多可以同時看到連續的三組被拍攝並上傳的照片與分析。 中間那組是我與我的同事 R 大 。 右邊那組是我的兩位同事 G 大 以及 iR 大 (i 大不能亂用…)。 右邊那組同事笑得可開心著的了~

Read On →

CMAF 的提出,還無解的 Video Streaming 的規格聖戰

Apr 13 2017

所有的影音串流服務的營運單位都曉得, 日常的營運費用(OPEX)支出裏頭, 前三大的是支出分別是:

  • 內容版權費
  • 流量費
  • 人事成本

內容版權費是大老闆與首席內容官(Chief Content Officer)的事; 人事成本是營運長(Chief Operation Officer)與研發主管的事; 至於流量費嘛(以及與它高度相關的儲存空間費用), 我們都曉得這是影音服務有別於其它網路業的最大支出。 流量費也是這一篇 blog 或這個 CMAF 標準在關心的議題。

從多媒體技術的觀點來看的話,現在的影音串流服務是怎麼做到的呢? 以我微薄的知識與見聞來看,目前成熟的技術市場,大概是有以下的幾塊:

  1. (Adaptive) streaming protocols: MPEG-DASH, HLS, HDS, MSS, RTMP, …
  2. Container format: MP4, fMP4, TS, MOV, …
  3. Video codec: H.264, HEVC, VP9, …
  4. DRM: PlayReady, Widevine, FairPlay, …
  5. Caption: SRT, WebVtt, …
  6. Ad: VAST, VPAID, …

以一家有點規模, 平台有至少包含 Android, iOS, Web, STB, … 的 VOD (Video-on-Demand)服務來看, 一部影片,會因為上述的 1, 2, 4 這三點,少則要準備個 2 份,多則要個 3, 4 份。 然後 1 份裏頭,又會因為有 adaptive streaming 而有很多的 profiles, 然後一個 profile 又可能因為 media segmentation 而有很多的檔案。

以一部 60 分鐘的影片,10 個 profiles,5 秒為一個 media segment 來看:

video duration: 1 hour
segment duration: 5 seconds
adaptive profiles: 10 (audio and video)
media segments: 60 * 60 * 10 / 5 = 7,200

一份會有 7,200 個檔。
如果來個 3, 4 份的話,就是會有 21,600 ~ 28,800 個檔案。

這對於儲存空間來說,是一筆支出,但更嚴重的,是對於流量的支出。 原本,一部影片,CDN 只要 cache 個一份, 現在因為上述的原因,變成要 cache 個兩三四份,糟透了。 理論上,網路流量的支出是要高於儲存的支出的,而且高很多。 除非,你在經營一家沒有人看的影音服務…

2015 ~ 2016 年之間,兩大巨頭,Microsoft & Apple,坐下來談一件事。 他們針對上述的問題,做了初步的努力,這個產物就是 CMAF (Common Media Application Format)。 CMAF 繼續了 MAF 的特性(或說是美德也行), 它並沒有定義任何新的技術或規格, 相反的,它是基於現在的技術規格下, *挑選(或限制)*出了一些規範(ex, profiles)來符合當下的軟硬體需求。

Read On →

就只是看了幾部電影

Mar 25 2017

遇到久久沒見到的老朋友時,最常聽到的開場白是: 「你的工作常常飛來飛去喔?!」

拜 KKStream 業務與任務的衝刺, 老闆的信任與機會的提供, 以及同事擔任後盾, 一年內是稍為飛了好幾趟。

每一趟的飛行,大多是在電影與書籍中渡過, 偶爾會有個機會與鄰座的飛客聊上一回兒,這個要看運氣。 我很愛這種觀影經驗。 獨自一人;無法逃開;Bose 耳機帶來的隔絕; 像二輪戲院般的一場接著一場… 說它是獨一無二也不為過。

Read On →

KKStream No Slander

Feb 28 2017

Teamwork is hard, but the result could be sweet if something was conducted right.
It’s a sorta mixture of plans, trust and chemical.
Everyday
I get some score and some penalty.
I learn something a little bit.
It reminds me of telling a good story in animation industry…

2016 年,在公司 HR 部門的安排與協助下,我們(KKV)體驗了一堂 “承諾!承諾! 體驗式學習課程”。 過程中有個有趣的競賽活動,它是這樣子的:

  • 所有人打散分組,每一組代表一個國家。
  • 每個國家的起始資源與數目不同。有的國家盛產食物,有的特別有錢,有的環境資源保育做得較好。
  • 每個國家也都有各自的勝利條件:不同資源有不同的目標數目。
  • 整個遊戲只會進行 N 回合,時間是有限且維一不可逆也無法交易的資源。
  • 每一回合開始,國家之間在不能揭露太多資訊的前提下,做著「不太能說話」的溝通與交易。
  • 接著,開始進入互相攻堅階段,每個國家有一些毀謗球(一樣有個數限制)可以互相廝殺。
  • 打輸的國家,可以看有沒有別的國家願意挺你。輸的一方,資源就會被被整個吃掉,而且採連坐法。
  • 最後一個回合結束後,看每個國家的達標狀況~

Read On →

MPEG-DASH 開源專案

Jan 31 2017

據說,我在參加了某一場 AWS Taiwan 舉辦的活動後, 曾對著一群人,豪邁的說出了「我們來在台灣辦例行性的 streaming workshop」吧! 然後,與大部分的政客一樣,只有發聲,沒有行動,遲遲沒有任何動作。 我當時一時興起,以為,只要有人先說出口, 就自然會有其它人出來接棒,執行。當然,我也會全力協助與參與…

但就像 g0v 的座右銘:

「不要問為何沒有人做這個,先承認你就是『沒有人』」。
因為,「沒有人」是萬能的。

http://g0v.tw/zh-TW/join.html

過了快一年,似乎沒有因此產生什麼變化, 想說先做點什麼一個人可以做的,簡單一點的事好了。 於是有了這麼一篇,從分享簡單而公開的資訊開始。 夾雜點個人觀點,然後期待有人跳出來指正我哪寫錯了, 或是提供 patch ;D

MPEG-DASH 起始於 2010 年,2011 年有了草案。 同年,成為國際標準。於 2012 年以 ISO/IEC 23009-1:2012 的型式發佈。 這樣的一個標準,因為 video streaming 成了新世界的載體,漸漸成為基礎建設。 於是有不少開源專案:

Read On →

AWS re:Invent 2016 Recap Taiwan

Jan 17 2017

2016 12 月,KKBOX,KKStream 以及 KKTV 共派出六位同事前往美國 Las Vegas, 參加一年一度的 AWS re:Invent 盛會。 相較於 2015 年的第一次去,這次有更完整的分工,帶回來了更多不一樣的觀點。 出發往 Vegas 前,我們各自依自己的工作崗位與個人興趣,認領了不同的議程。 只能說,非常的包羅萬象。 從最基本的 storage, computing, queuing, database, 到像是 CI/CD, big data, machine learning, IoT serverless, 或是非常重要的 cost optimization, site security, multiple accounts, … 等都有。

因此, 當收到來自 AWS Taiwan 友善的邀請參加 AWS re:Invent Recap 2016 | Taiwan, 希望能提供個十分鐘的 keynote 與台下的與會者分享時, 我二話不說就答應了,即使那個時候沒有任何想法 ;)

這個只有十分鐘的 keynote 分享,實在很難準備。 想來想去, 就挑 re:Invent 行前,KKStream 與 KKTV 最在意的三個議題來聊一下。

Read On →