【データ分析】「選手出場時の勝率比較」によるミスリード【ベジェリン、セドリック】

2021-04-06データ分析記事紹介

先日、Football LondonのChris Wheatly記者が以下のような記事を投稿していた。

この記事に関して話題を呼んだのは、セドリックが先発した試合での方がアーセナルは勝利を収める可能性が高く、そのためセドリックの方が良い右サイドバックのチョイスである、という主張だ。

引用元: Football London (https://www.football.london/arsenal-fc/news/arsenals-best-right-back-revealed-20307197)

確かに、このグラフのように、セドリックが試合に出場した時にアーセナルの勝率が高いというのは疑いようのない事実だ。

だが、このデータをもとにセドリックの方がアーセナルにとって優れた右サイドバックであると結論付けるのは、とんでもないミスリードでもある。

もちろんミスリードだからといって、セドリックが優れた右サイドバックではないということが言いたいわけではないが。(私は既にこの二人を比較する記事を書いているので、どちらがよりアーセナルに向いた右サイドバックなのか?という議論にはこれ以上ここでは触れない。)

参照:

ではなぜ、出場時の勝率、というデータがミスリードを誘うかというと、これらの数字は、まず第一に、それぞれの試合での対戦相手のクオリティなどの要素を全く考慮していないし、第二に、サッカーにおいては引き分けが十分な結果の場合もあるからだ(アーセナル対オリンピアコス戦のセカンドレグのように、敗戦が十分な結果であることすらある)。

今回、ベジェリンとセドリックそれぞれが出場した試合での対戦相手のレベルの違いを示すために、アーセナルが試合に勝利する可能性を各社のベッティングオッズが締め切られた時点の数字から、アーセナルの勝率を算出してみた。以下のグラフを見れば、より現実に近い景色が見えてくるはずだ。

(左が実際の勝率、右が、賭けオッズから計算したそれぞれが先発した試合のアーセナルの期待勝率)

セドリックが先発した試合でアーセナルの勝率が高いのは事実だが、実際のところ、そもそもセドリックはアーセナルが勝利する可能性がより高いような試合で先発している、という事も見て取れる。

このグラフで見ると、ベジェリンが先発した試合のアーセナルの勝率は多少期待値を下回っている程度で、実際にはほぼ想定された通りの勝率である、ということもわかる。

これを、勝ち点に換算すると、そもそもセドリックが先発した試合は、平均してアーセナルが勝ち点2.1を獲得できるような想定の対戦相手との試合で、この数字がナイルズの場合は1.9チェンバースの場合は1.8で、ベジェリンの場合は1.6だったということだ。

(訳注: つまり、実際の勝率以前に、そもそもベジェリンはアーセナルが最も勝ち点を獲得するのが難しいような対戦相手に対して先発する機会が多い、ということ)

もちろん、セドリックの方がベジェリンより優れた右サイドバックだと主張したいのであれば、色々な根拠があるだろうが、少なくとも、それに出場試合の勝率を用いるのは良い選択だとは言えない。

source(当該サイトの許可を得て翻訳しています):

Posted by 山中拓磨