#閒聊 PSxG - 用進階數據衡量球員的終結與撲救能力

隨著大數據時代的到來,運動賽事的管理層、球員,乃至於粉絲與博彩公司不再只奉「得分」為信條,而是開始以所謂「進階數據」來評估並預測球員(隊)的實際表現。作為全球最熱門的運動,足球當然也沒有在這波熱潮中落後。 今天我們要看到的,就是能夠判斷球員終結能力與撲救能力的進階數據--射門後進球期望值(PSxG,Post Shot Expected Goals;又名Expected Goals on Target,射正進球期望值,xGOT),不過在進入這個主題前,還是要先來複習一下足球進階數據的鼻祖,也是應用最廣的數據:進球期望值(xG,Expected Goals)。 ⚽什麼是xG? 根據數據網站Opta的定義,xG是「歸納近百萬次射門累積的數據,來統計出在每個類似情境下,射門形成進球的機率(或期望值)」,其中「情境」包括但不限於以下因子: 。射門距離 。射門角度 。其他球員的站位(是否擋到射門者或門將) 。門將站位 。防守者對射門者的壓迫 。射門部位、方式(左腳、右腳,頭槌、凌空抽射、單刀等) 。形成射門的pattern(運動戰、快速反擊、定位球等) 。創造射門機會的動作,如助攻方式(直塞、傳中等) 考量進這些因子(用這些因子來推斷哪些是所謂「類似情境的射門」)後,每記射門都會有一個對應的xG來作為它的「期望值」,這個數值會介於0到1之間,例如xG為0.1的射門表示過去每十次類似的射門會有一次形成進球。 2018年世界盃最佳進球,Pavard在禁區外的凌空抽射只有0.03的xG,考量難度與觀賞性,最佳進球當之無愧。
少數情境,如十二碼,因為唯一變數只有是用左腳或右腳射門,因此直接根據過去十二碼的進球率給定了0.79的xG。 ⚽xG的缺陷? 對xG有了初步認識後,隨之出現的是一個問題:xG衡量的是機會的品質(換句話說,球員/隊創造機會的能力),而非把握機會的能力。有些人會誤會實際進球數(G/GF)一定會隨著時間逐漸向xG回歸,但事實上,這個觀念是錯的,原因很簡單: 同樣情境(xG相同)下,Haaland的射門能打在球門死角,但Werner可能會打中球場上空的飛機 (?
megapx
(Werner:不會真的打中飛機了???) 就像我們在前文提到的,xG(球隊創造機會的能力)只考量起腳射門前的因素,而忽略了射門的品質與射門後的情境,球員的終結能力便會在這個數據中被埋沒,某方面來說,xG的統計意義甚至不如「射正」這個傳統數據。 那麼,有沒有能夠真實反映出球員終結能力的數據呢?當然有,也就是我們今天的主題PSxG。 ⚽PSxG是什麼? 同樣根據Opta的定義(註:Opta原文用的是xGOT,但為了方便整理,以下都以PSxG代稱),PSxG為「根據射門落點,形成進球的機率/期望值」(同樣會介於0到1之間),考量的主要因子有兩個: 。射門的xG 。射門的落點(通過球門線時的位置) 同樣情境(xG相同)的射門,打向球門左上角肯定比直直打往門將身上有更高的進球期望值(因為有考量xG,門將的站位也會被算進PSxG裡),此時前者的PSxG自然就比後者的高了。 Emiliano Martínez在世界盃決賽的「那個」撲救,射門者Kolo Muani的PSxG為0.55,可以解讀為是Martínez出擊及時才讓xG乃至於PSxG下滑。
megapx
megapx
需要注意的是,PSxG只考量「射正」的情境,因為偏出目標的射門形成進球的機率為0;另外,烏龍球也是不計入PSxG的,否則我無法想像這粒烏龍球的PSxG到底是多少:
另外,根據Opta提供的資料,PSxG也會計入「最後一名球員擋球」,也就是護空門的情境(通常來說射門被球員擋下是不會計入射正的);例如世界盃阿根廷對沙烏地阿拉伯一役,Tagliafico被阿拉伯球員護空門的射門,就有0.84的PSxG。
megapx
上面這張截圖(左為xG,右為PSxG)就出現了四種情境:進球、撲救(護空門)、被擋下(不計入射正,因此沒有PSxG)、偏出目標(同樣沒有PSxG)。 ⚽PSxG的應用 PSxG可以衍生出另外兩個進階數據:Shooting Goals Added(SGA)與Goals Prevented,分別用來衡量球員的終結能力與門將的撲救能力。 先從SGA開始說起。SGA的公式為PSxG-xG:球員的射門品質為他增加了多少進球期望值。這個數值越高,表示球員越能夠將微小的機會轉化為進球。今年賽季,SGA名列榜首與榜眼的當然是我們熟悉的兩位超級射手:Haaland的射術讓他比起平均值多了2.75的進球期望值,老孫則是不遑多讓的2.13。
megapx
只要是水準以上的射手,這個數值一定會是正數,因此我們會用另一項數據來判斷球員每次射門的產值:Shooting Goals Added per Shot(總SGA除以總射門數),藉此來將「射門次數」的影響降低。前面提到的Haaland跟老孫,雖然Haaland的SGA較高,但那是Haaland射門次數(29次)比老孫(16次)更多,累積起來的結果。考量進每次射門增加的進球期望值(也就是純粹的終結能力),老孫(0.13,Haaland則是0.09;另外,三球王是0.11)才是個更好的終結者。(看到了吧,某靜宜哥)
megapx
Goals Prevented則是考量了撲救難度,來改善「撲救率」非0(成功撲救)即1(被進球)的問題。這項數值的公式較為簡單:PSxG-實際失球數(GA或GC),數值越大代表門將表現越好。 本季英超表現最佳的門將是狼隊的José Sa,總計為球隊守下了4.03球。
megapx
⚽如何用xG與PSxG來解讀球隊表現? 前面我們介紹了xG與xG的不足,並且用PSxG來補上了這個缺陷,接下來讓我們看看PSxG應用的實例:今年賽季的車車。
megapx
車車本季的xG為11.5(英超第6),PSxG為9.0(英超第10),這表示車車團隊貧弱的終結能力讓球隊在理論上少了超過兩粒進球;而車車目前實際上只進了5球,則表示即使車車少有地打中目標,也都會被對方門將或防守球員化解。 造成這個現象的可能原因有很多,而車車目前最大的問題除了終結能力不足以外,還有射正次數不足的問題(因為xG會算進偏出目標的射門,PSxG不會,這也是車車目前SGA為負的原因)--射正率在英超排在14位,但總射門數為第五位。 因此我們可以推論出,車車的進球數遠低於xG,很大一部分原因是他們自身沒辦法有效率地威脅對方球門,但PSxG也遠高於實際進球數,表示車車目前的「卡彈」,還真的是有一定的運氣不好的成分 ⚽結論 現階段xG、PSxG與其衍生數值可以說是最能推論出進球機率的數據,所以下次你家門將又自爆的時候,冷靜點,先看看PSxG,搞不好那個看起來鳥鳥的射門其實是極具威脅性的一腳呢。
megapx
如果你家前鋒又双叒叕在門前打飛機(你可能很難想象自家前鋒是Higuaín→Werner→Havertz是什麼體驗),在脫口而出「我阿嬤都打得進」之前,也可以參考一下xG,搞不好還真的是進球率極低的射門。
megapx
愛心跪
14
留言 14
文章資訊