台灣資料科學年會 2017,期待的演講者們

Sep 23 2017

台灣資料科學年會 2017 的議程已經放出來幾天了,一直到這兩天才稍為有空瞄一下議程。 在強力擁銷員 陳昇偉博士 的熱情邀約下,KKBOX 集團一口氣貢獻了四個不同面向的主題, 兩個主題與人工智慧相關,另外兩個主題比較偏向資料科學。 搭著有點熟悉又有點陌生的臺鐵電聯車,在帶著幾朵雲的一片藍空下, 做點小功課,先單純的記下幾位講者名單。

似乎第一輪感興趣的講者,教授/學者/教育家居多。挺好的 :)

Read On →

如果 KKBOX Data Game 17.06 是一家 startup 的話…

Jul 7 2017

就如同 Paul Graham 的 Hackers & Painters: Big Ideas from the Computer Age 裏頭說的, 「這是個對科技阿宅最棒的年代,只要夠 nerdy,夠有想法,夠有生意頭腦,那就去創業吧。」

今年五月,KKV (KKStream & KKTV) 內部執行了一個 KKV Data Game 17.05。 隨後的六月,毅然決定對外開放,搭上 PyCon Taiwan 2017 的順風車,辦了個 KKBOX Data Game 17.06。 主辦人之一的 @ironhead 寫了篇 blog:Stories of KKBOX Data Game 17.06。 而這一篇,打算以另一個觀點來聊聊這個 game 到底是怎麼樣的一個 game~

如果,我們把整個 KKBOX Data Game 17.06 當作一家 startup,會是怎麼樣的一回事?

Read On →

關於 KKV Data Game 17.05 的兩三件事

May 23 2017

趨使一件計劃之外的事,產生點意外的火花,最快的方法之一,就是辦一個活動了。

當全世界(好吧,其實只有一小群人)都開始瘋狂談論 AI, Machine Learning 時, 而你發現你們家的基礎建設還很不足, 有很多 data pipeline, data engineering 的事沒做好, 根本無暇去想那個什麼 AI (stuff or buzzwords)之類的… 又或者,雖然你們做了一些 data analytics, 也開發了些所謂的 recommendation system, 但認真想想,其實都還離完全的商業目標有那麼一段距離…

KKStream / KKTV / KKV 很不巧的,剛好也在經歷上述的狀況。 雖然我們有老大哥 KKBOX 可以咨詢,但基本功還是得自己一步一步來。 最最基本也重要的任務:1)組織資料團隊;2)建立資料認知;3)執行資料工程。 都無法假它人之手。

我們在(永遠都會)人仰馬翻的日常業務裏頭,啟動了一個小活動。

KKV Data Game 17.05

  • 人:所有 KKV 集團(KKStream + KKTV 2.0)的同事。
  • 事:根據拿到的,過去一段時間 KKTV 用戶的看劇行為與資料,預測(猜)用戶接下來會看的劇。
  • 時:05/04 - 05/11,僅僅一週。
  • 地:透過 Kaggle in Class 來舉辦整個比賽。
  • 物:使用 KKTV 的真實資料。

Read On →

除了獨到的品味,你還需要能堅持下去的時間

May 12 2017

2015-09-16,寫了一篇 blog – 〝除了獨到的品味,你還需要能堅持下去的時間“。 已經有點忘了時空背景了,不太記得確實的整個來龍去脈。 大約記得,那時候的我離開待了九年的電腦動畫”創業”產業, 剛剛進入 KKBOX Video 部門,一個一直存在於我想像中的網路軟體產業。 說〝一直存在“,也僅僅是因為我一直相信動畫產業與軟體產業是可以互通的,在某種層面上。

在那一篇 blog 裏頭,我分享了 Ira Glass 的一段採訪影片, 影片中,Glass 在分享他個人對於 「創意」「職涯」「初學者」「品味」「專業」「堅持」…的一個看法。 也沒有像前面這一堆字眼那麼的複雜,就是個他的個人發現, 然後以一種溫柔而睿智的方式,簡短的聊了一下~

沒記錯的話,這影片我應該是更早些年就看過了,至少還在太極影音的時候。 那時的我,在熱愛的 Computer Graphics, Computer Science, Computer Animation 遇到不少挫折, 然後偶然間看到一位在地球某個角落的創作者,他分享了這一段影片。 因為這段影片,讓我懂得怎麼面對自己內心的脆弱,撐過挑戰。

影片裏的對白是這麼開始與結束的:

Nobody tells this to people who are beginners. I wish someone had told me. … It’s gonna take a while. It’s normal to take a while. You just gotta fight your way through.

最近,我啟動了一個個人的小小計劃: 每隔一兩週,講個小小故事,分享給同事或家人。 故事可能是我很愛的、影響我的、幫我渡過難關的、我親自經歷過的、我親自實驗過的… 是個「小小傳承」的故事。 說〝小小“,是因為希望它像一則 tweet 那樣優雅, 至少讓人在失去耐心前,可以剛剛好消化完。

而這一則故事,剛好就在上週與 KKStreamers 的週會中提到。


以下是 2015 的原文,因為原影片已經被拿掉,改放上類似的。


我非常喜愛一段短短的,只有約五分鐘長的一段影片,是由 Ira Glass 主持的 This American Life 這個節目中的一段。 內容是 Glass 分享了一段他對於品味與創意之間的關係與觀察。

這個是 YouTube 上頭一個快節奏的文字版。

以下是影片內口白的節錄:

Nobody tells this to people who are beginners. I wish someone had told me. All of us who do creative work, we get into it because we have good taste. But there is this gap. For the first couple years you make stuff, it’s just not that good. It’s trying to be good, it has potential, but it’s not. But your taste, the thing that got you into the game, is still killer. And your taste is why your work disappoints you.

Read On →

Google Cloud Next '17: 玩玩 Vision API

Apr 14 2017

今年三月,急就章的去了一趟 Google Cloud Next ‘17, 重新體驗了一下 Cloud Vision API, 順道玩玩別人拿它來做的小實驗。

這個在現場的 Vison API demo booth, 最多可以同時看到連續的三組被拍攝並上傳的照片與分析。 中間那組是我與我的同事 R 大 。 右邊那組是我的兩位同事 G 大 以及 iR 大 (i 大不能亂用…)。 右邊那組同事笑得可開心著的了~

Read On →

CMAF 的提出,還無解的 Video Streaming 的規格聖戰

Apr 13 2017

所有的影音串流服務的營運單位都曉得, 日常的營運費用(OPEX)支出裏頭, 前三大的是支出分別是:

  • 內容版權費
  • 流量費
  • 人事成本

內容版權費是大老闆與首席內容官(Chief Content Officer)的事; 人事成本是營運長(Chief Operation Officer)與研發主管的事; 至於流量費嘛(以及與它高度相關的儲存空間費用), 我們都曉得這是影音服務有別於其它網路業的最大支出。 流量費也是這一篇 blog 或這個 CMAF 標準在關心的議題。

從多媒體技術的觀點來看的話,現在的影音串流服務是怎麼做到的呢? 以我微薄的知識與見聞來看,目前成熟的技術市場,大概是有以下的幾塊:

  1. (Adaptive) streaming protocols: MPEG-DASH, HLS, HDS, MSS, RTMP, …
  2. Container format: MP4, fMP4, TS, MOV, …
  3. Video codec: H.264, HEVC, VP9, …
  4. DRM: PlayReady, Widevine, FairPlay, …
  5. Caption: SRT, WebVtt, …
  6. Ad: VAST, VPAID, …

以一家有點規模, 平台有至少包含 Android, iOS, Web, STB, … 的 VOD (Video-on-Demand)服務來看, 一部影片,會因為上述的 1, 2, 4 這三點,少則要準備個 2 份,多則要個 3, 4 份。 然後 1 份裏頭,又會因為有 adaptive streaming 而有很多的 profiles, 然後一個 profile 又可能因為 media segmentation 而有很多的檔案。

以一部 60 分鐘的影片,10 個 profiles,5 秒為一個 media segment 來看:

video duration: 1 hour
segment duration: 5 seconds
adaptive profiles: 10 (audio and video)
media segments: 60 * 60 * 10 / 5 = 7,200

一份會有 7,200 個檔。
如果來個 3, 4 份的話,就是會有 21,600 ~ 28,800 個檔案。

這對於儲存空間來說,是一筆支出,但更嚴重的,是對於流量的支出。 原本,一部影片,CDN 只要 cache 個一份, 現在因為上述的原因,變成要 cache 個兩三四份,糟透了。 理論上,網路流量的支出是要高於儲存的支出的,而且高很多。 除非,你在經營一家沒有人看的影音服務…

2015 ~ 2016 年之間,兩大巨頭,Microsoft & Apple,坐下來談一件事。 他們針對上述的問題,做了初步的努力,這個產物就是 CMAF (Common Media Application Format)。 CMAF 繼續了 MAF 的特性(或說是美德也行), 它並沒有定義任何新的技術或規格, 相反的,它是基於現在的技術規格下, *挑選(或限制)*出了一些規範(ex, profiles)來符合當下的軟硬體需求。

Read On →

就只是看了幾部電影

Mar 25 2017

遇到久久沒見到的老朋友時,最常聽到的開場白是: 「你的工作常常飛來飛去喔?!」

拜 KKStream 業務與任務的衝刺, 老闆的信任與機會的提供, 以及同事擔任後盾, 一年內是稍為飛了好幾趟。

每一趟的飛行,大多是在電影與書籍中渡過, 偶爾會有個機會與鄰座的飛客聊上一回兒,這個要看運氣。 我很愛這種觀影經驗。 獨自一人;無法逃開;Bose 耳機帶來的隔絕; 像二輪戲院般的一場接著一場… 說它是獨一無二也不為過。

Read On →

KKStream No Slander

Feb 28 2017

Teamwork is hard, but the result could be sweet if something was conducted right.
It’s a sorta mixture of plans, trust and chemical.
Everyday
I get some score and some penalty.
I learn something a little bit.
It reminds me of telling a good story in animation industry…

2016 年,在公司 HR 部門的安排與協助下,我們(KKV)體驗了一堂 “承諾!承諾! 體驗式學習課程”。 過程中有個有趣的競賽活動,它是這樣子的:

  • 所有人打散分組,每一組代表一個國家。
  • 每個國家的起始資源與數目不同。有的國家盛產食物,有的特別有錢,有的環境資源保育做得較好。
  • 每個國家也都有各自的勝利條件:不同資源有不同的目標數目。
  • 整個遊戲只會進行 N 回合,時間是有限且維一不可逆也無法交易的資源。
  • 每一回合開始,國家之間在不能揭露太多資訊的前提下,做著「不太能說話」的溝通與交易。
  • 接著,開始進入互相攻堅階段,每個國家有一些毀謗球(一樣有個數限制)可以互相廝殺。
  • 打輸的國家,可以看有沒有別的國家願意挺你。輸的一方,資源就會被被整個吃掉,而且採連坐法。
  • 最後一個回合結束後,看每個國家的達標狀況~

Read On →

MPEG-DASH 開源專案

Jan 31 2017

據說,我在參加了某一場 AWS Taiwan 舉辦的活動後, 曾對著一群人,豪邁的說出了「我們來在台灣辦例行性的 streaming workshop」吧! 然後,與大部分的政客一樣,只有發聲,沒有行動,遲遲沒有任何動作。 我當時一時興起,以為,只要有人先說出口, 就自然會有其它人出來接棒,執行。當然,我也會全力協助與參與…

但就像 g0v 的座右銘:

「不要問為何沒有人做這個,先承認你就是『沒有人』」。
因為,「沒有人」是萬能的。

http://g0v.tw/zh-TW/join.html

過了快一年,似乎沒有因此產生什麼變化, 想說先做點什麼一個人可以做的,簡單一點的事好了。 於是有了這麼一篇,從分享簡單而公開的資訊開始。 夾雜點個人觀點,然後期待有人跳出來指正我哪寫錯了, 或是提供 patch ;D

MPEG-DASH 起始於 2010 年,2011 年有了草案。 同年,成為國際標準。於 2012 年以 ISO/IEC 23009-1:2012 的型式發佈。 這樣的一個標準,因為 video streaming 成了新世界的載體,漸漸成為基礎建設。 於是有不少開源專案:

Read On →

AWS re:Invent 2016 Recap Taiwan

Jan 17 2017

2016 12 月,KKBOX,KKStream 以及 KKTV 共派出六位同事前往美國 Las Vegas, 參加一年一度的 AWS re:Invent 盛會。 相較於 2015 年的第一次去,這次有更完整的分工,帶回來了更多不一樣的觀點。 出發往 Vegas 前,我們各自依自己的工作崗位與個人興趣,認領了不同的議程。 只能說,非常的包羅萬象。 從最基本的 storage, computing, queuing, database, 到像是 CI/CD, big data, machine learning, IoT serverless, 或是非常重要的 cost optimization, site security, multiple accounts, … 等都有。

因此, 當收到來自 AWS Taiwan 友善的邀請參加 AWS re:Invent Recap 2016 | Taiwan, 希望能提供個十分鐘的 keynote 與台下的與會者分享時, 我二話不說就答應了,即使那個時候沒有任何想法 ;)

這個只有十分鐘的 keynote 分享,實在很難準備。 想來想去, 就挑 re:Invent 行前,KKStream 與 KKTV 最在意的三個議題來聊一下。

Read On →

KKV Programming Contest 2016

Nov 13 2016

2016/11/11, 有一群愛台灣的人進電影院看李安導演的比利‧林恩的中場戰事 Billy Lynn’s Long Halftime Walk 。 有更多人受到商人的鼓吹與店家的特惠活動,在當天貢獻了不少商業行為,買了不少東西,活絡了市場。 然後有一群來自 KKBOX 子集團 – KKV (KKStream & KKTV) 的人,窩在台北的一個角落, 他們有的是在寫程式 PK;有的下注手指彩卷。 至於喝 Orion 啤酒、聽台灣的故事,聆聽現場的演奏,則是每個人共同享受這個下午時光的方式。 是的,我要記錄的就是我們這一群人下午的一個小故事…

Read On →

Everything is about communication!

Nov 10 2016

You are a front-end programmer. What do you do daily is like:

  • open your coding editor/IDE,
  • open your testing project in the browser,
  • open doc sites of libraries you are using or referencing,
  • read your/others codes, comments, official docs, tech blogs, stackoverflow, …
  • write something in the editor,
  • ask the machine to interpret your writings and respond.

What you are really doing is to communicate, either with docs done by other people, or with machines by code snippets.

看看這張來自座落在緬甸仰光的 Rangoon Tea House 菜單,光是茶就有 16 種! 雖然差別只在於比例的不同,但每一種比例的調配都有它自己的名字! 某個程度上,它在用圖表與名字的方式與你溝通…

Read On →

Agile Business Trip

Nov 9 2016

洽公出差,在某種情境下,會剛好是一群人前往。
有人擔任大老闆坐鎮帶團;有人負責業務談判;
技術長負責回應實作與技術決策;專案經理放在工作流項目與時程的安排;
各司所職,各有專長,挺美好的不是?
但,現實是殘酷的。
更多時候,會有不按牌理的事件發生,或是談論範籌不是一個人或出差一行人可以搞定的。
這讓我想到 Agile, Scrum, … 這一類的工作文化~

Read On →