棒球運動與資料統計的關係已經有一段歷史了。超過 150 年前,第一顆在專業棒球賽中飛越本壘板的投球出現後,發生在棒球賽場上的一舉一動,都被歌頌為美國歷史上備受喜愛的經典時刻。而隨著棒球數據資料的種類與數量爆炸性的成長,雲端運算的橫空出世可說是顛覆了所有的遊戲規則。
今日,雲端科技讓 MLB 能夠蒐集並分析 2430 場季賽中,每一場比賽多達 2500 萬份的唯一數據點。數據分析不但有助於提升球員的比賽表現,也拉近粉絲與棒球比賽的距離,我們將帶領你了解 MLB 是如何做到的。
用比快速球還快的速度在場上計算數據
從第二次擊球練習到結束比賽的再見安打,MLB 都不間斷的在蒐集場上的數據。用來分析球員動作與運動能力的 Statcast 追蹤技術,能夠用以前無法達到的方式去蒐集並分析大量的棒球數據。Statcast 從 2020 年開始啟用鷹眼系統,此系統在 30 個所有的 MLB 棒球場架設 12 台高解析度的相機,以每秒 30 幀的速度追蹤球員與球的每一個動向,而每一個球員的身上都有 18 個不同的數據點。在球離開投手掌握的順間,鷹眼就能捕捉到約 60 個數據點,包括它抵達打者前的速度及位移角度。
透過 Anthos 及 GKE 叢集,這些相機直接在比賽現場將影片串流處理成架構化的資料,並且即時的將資訊發送到計分板與廣播系統。結果就是,這些統計數據的顯示速度比每小時 95 英里的投球速率還要快。至於在家觀賞球賽的球迷,則可以透過鷹眼的數據直播,從本壘板的中心視角看見視覺化的好球帶。
「藉由使用 Anthos,我們能就地完成所有事情,並且備份整個在 Google Cloud 上運行的軟體基礎設施。」MLB 的軟體工程資深總監 - Rob Engel 表示。「此雲端系統能夠就地部署,而且我們不需要為了它做出太大的調整。」部署環境的一致性對於需要在雲端、資料中心、或賽場中運行雲端運算的 MLB 開發者來說是很重要的。
當賽場上內建的的系統故障時,Anthos 也能藉由擔任代打角色成為候補解決方案。舉例來說,如果洋基球場的廣播系統停止運作,MLB 可以橫跨紐約到大都會的主場 Citi Field 、或甚至是到雲端來運行程式碼,讓球賽在不中斷的情況下繼續廣播。「如果我們在任何的球場遇到任何問題,我們都能將資料發射到 Google Cloud,並在那繼續運行。」Engel 表示。
為這些驚人的數據資訊增添更多脈絡
至於現今的數據是否有辦法與這幾年以來蒐集的歷史資料做比較呢?Josh Frost,MLB 的 PM 副總解釋:「球在脫離球棒後的瞬間速率是每小時 110 英里,這樣到底是好是壞呢?與整個聯盟的平均表現比起來怎麼樣呢?這是我們做為一個企業真正關心的事情 - 不只是將資料提供給人們,而是為資料增添脈絡、為人所用,並讓人們因此更享受比賽。」
即使鷹眼能夠精準測量一個速率達每小時 95 英里的投球落點,仍然是由裁判去判定此球是好球或壞球,或者判斷一個球員是否安全上壘。而這就是手動操作人員上場的時候了!在每一顆球被投出前,MLB 工作人員會手動紀錄目前的投手、打者、球局等後設資料。
在球賽進行期間,MLB 會不間斷的上傳比賽數據至 Google Cloud,每一季的數據資料甚至超過 25 兆位元。每一位球員的動作、位置追蹤數據會存放在 Bigtable,而其他的比賽資訊會儲存在 Cloud SQL 上的 PostgreSQL。而每一晚 MLB 會進行資料的批次處理,使用 Dataflow 將比賽數據從 Bigtable 及Cloud SQL 移至雲端儲存槽和 BigQuery 裡。
在 MLB Gameday Machine 中,有 150 年來集結而成的棒球數據邏輯,裡面混合了現今的即時追蹤數據及傳統數據資訊 - 如平均擊球率、三振、打數等。所以當一位球員決定要盜壘,並以每秒 30 英尺的速度衝刺時,MLB 可以立即將此速率分級,並且查看這樣的速度對跑者來說是否屬於前段班梯次。
將資料的無限可能推至高點
每一項數據資訊 - 不管是現在還是以前的 - 都被放進像 Baseball Servant 這樣的客戶端工具中的 MLB Stats API 介面,讓粉絲能夠搜尋打擊距離及擊球角度等資訊。這項工具也被用來支援直播的即時應用,如 MLB app 和 Film Room 等。「我們會把 API 裡的數據拉出來使用,從查看大聯盟場上的表現,到評估是否讓球員加入、了解球員的表現趨勢等。這些數據有無限的應用方式。」Arizona Diamondbacks 的棒球系統總監 John Krazit 表示。
伴隨著資料的無限可能,MLB 正在醞釀一些令人驚豔的新體驗。今年曝光的消息就是 MLB 會將 FieldVision 的功能帶往全新的領域。此項科技使用存放在 Bigtable、並且由鷹眼追蹤的球員動向數據,以提供粉絲球場上的 3D 視角。擁有從場上任何位置生成重播畫面的功能,FieldVision 超越以往的 MLB 所能提供的見解,從粉絲的桌面或手機 app 拉近他們與場上的距離。
蓋亞資訊為 Google 卓越合作夥伴(GCP Premiere Partner),若你也希望像 MLB 一樣,透過 Anthos 及 GKE 叢集將串流媒體快速處理成架構化資料,或將大量數據存放在 Bigtable 或 Cloud SQL 中,並以 BigQuery 分析比較、甚至是生成 3D 畫面,為數據資料增添脈絡並應用到極致,歡迎點擊下方按鈕立即諮詢喔~