– گل های مورد انتظار را چطور محاسبه کنید؟
– رویکردهای مختلف برای مدلسازی گل های مورد انتظار کدامند؟
– کدام نوع مدل گل های مورد انتظار از همه دقیق تر است؟

معیار گل های مورد انتظار که پیش از این فقط به جامعه‌ی داده‌های ورزشی کوچکی تعلق داشت، اکنون با دیگر آمار و ارقام رایج فوتبال مثل در اختیاز داشتن توپ، شوت به سمت دروازه، و تعداد خطاها ارتباط دارد. اما، رویکردهای بی شماری برای گل های مورد انتظار وجود دارد. این مقاله مدلهای مختلف مورد استفاده و چگونگی تولید خروجی های مختلف در آنها را بررسی میکند.

هدف در فوتبال این است که بدون گل خوردن به حریف مقابل گل بزنند. شاید به دلایلی مثل تصادفی بودن نتیجه یا نقش شانس در نتیجه‌ ی نهایی ساده به نظر برسد، اما تیم ها همیشه به نتیجه ای که لیاقت آن را دارند نمی رسند.

به همین دلیل است که تجزیه و تحلیل داده و معیارهایی مثل گل های مورد انتظار در شرط بندی ورزشی مهم است – میتوانیم عملکرد تیم ها را از دیدگاه تحلیلی بررسی کنیم و ادعا کنیم که “باخت فلان تیم از روی بدشانسی بود”.

از آنجا که یک شوت عمل گل زدن را تعریف میکند، در نتیجه داده‌های مربوط به شوت مهمترین عامل در مدل گل های مورد انتظار است.

گل های مورد انتظار (که اغلب با xG نشان داده میشوند) یکی از شکل های تجزیه و تحلیل داده ها هستند که تیم های فوتبال از آن استفاده میکنند و بین شرط بندان هم بسیار محبوب و رایج است. آمار و ارقام گل های مورد انتظار همیشه یکسان نیستند زیرا از مدلهای مختلفی برای محاسبه ‌ی آنها استفاده می شود.

مدل ها از ساده شروع میشوند تا پیچیده. در ادامه نحوه‌ ی کار مدل های مختلف گل های مورد انتظار را میبینیم. حالا میخواهیم بدانیم که طرز کار این مدلهای مختلف چگونه است و خروجی های تولید شده توسط آنها چقدر با هم فرق دارند.

استفاده از داده‌های ساده‌ی مربوط به شوت

اندرو بیزلی پیش از این نحوه محاسبه گل های مورد انتظار را با استفاده از یک مدل داده  ای اولیه شوت توضیح داده است. از آنجا که شوت عمل گل زدن را تعریف میکند، داده‌های شوت مهمترین عامل در مدل گل های مورد انتظار هستند – رویدادهای بیشماری در مسابقه ‌ی فوتبال نقش دارند که روی گل زدن تاثیر میگذارند، اما وقتی میخواهیم این نتیجه ‌ی خاص را پیش بینی کنیم، تعداد شوت ها بدون شک اهمیت زیادی دارند.

این یک رویکرد ساده است و از چیزی استفاده میکند که اوپتا آن را “شانس بزرگ” میداند – موقعیتی که در آن از یک بازیکن انتظار میرود تا گل بزند. همچنین از شوت های زده شده از داخل و خارج از محوطه هم استفاده میکند.

نرخ های تبدیل شوت به گل در پنج فصل گذشته‌ ی لیگ برتر نشان میدهد که ارزش xG برای شانس بزرگ برابر با 0.387 است (یعنی 38.7% شانس گلزنی)، ارزش شوت هایی که از داخل محوطه زده شده 0.070 است و ارزش شوتهایی که از خارج از محوطه زده شده 0.036 است.

تجزیه و تحلیل دقیق داده های مربوط به شوت

با توجه به اندازه‌ی وسعت زمین در فوتبال، یک شوت ممکن است از زوایای مختلفی زده شود و این مساله روی احتمال گلزنی تاثیر دارد. هر چه یک مدل با جزئیات بیشتری مکان شوت را تجزیه و تحلیل کند این مساله روی نتیجه‌ ی گل های مورد انتظار هم تاثیر میگذارد.

اگرچه این مدل شبیه مدل پایه ‌ی گل های مورد انتظار از اندرو بیزلی است، اما این نوع رویکرد از تحلیل های عمیقتری برای مکان شوت و تخصیص مقدار xG به آن استفاده می کند. ساده ترین راه انجام این کار تقسیم طیف شوت زنی بر گل به تور و سپس ترسیم نقشه‌ی هر شوت است.

فایده استفاده از این نوع مدل این است که در این مدل تفاوت بین شوت بازیکن مستقیما از جلوی دروازه (که احتمال گلزنی در آن بالا است)، و شوت بازیکن از یک زاویه ‌ی دقیق (احتمال گلزنی خیلی کم است)، وهمچنین اینکه آیا بازیکن شوت را با سر زده (گلزنی سختتر است) یا پا (گلزنی آسان تر است) را در نظر میگیرد.

مدل پائول رایلی مثالی خوبی از مدلهایی است که وقتی میخواهند یک مدل xG بسازند روش کمی پیشرفته تری برای تجزیه و تحلیل مکان شوت دارند.

در نظر گرفتن فرآیند حمله

البته فقط مکان شوت و بدنه‌ ی زمین نیست که احتمال گل شدن یک شوت را تعیین میکند. مسیری که بازیکن با توپ طی کرده نیز روی کیفیت شانس گل شدن این توپ تاثیر دارد.

برخی مدل ها بجای اینکه مقدار xG را فقط بر اساس مکان پرتاپ شوت به آن اختصاص دهند به چگونگی ایجاد فرصت شوت زدن هم توجه میکنند (برخورد، توپ مستقیم، ضد حمله، و غیره) و نحوه‌ی پرتاپ شوت را با جزئیات بیشتری تجزیه و تحلیل میکنند (شوت بعد از یک دریبل موفق پرتاب شده، بعد از بازگشت توپ توسط دروازه بان شوت شده، و غیره).

بدیهی است که این نوع مدل به داده‌ها و منابع بسیار بیشتری احتیاج دارد – xG مدل 11tegen11 نمونه ای از مدلهایی برای گل های مورد انتظار است که هنگام تخصیص مقدار xG به شوت ها، فرآیند گسترده تر حمله را هم در نظر میگیرد.

تاثیر دفاع روی xG

سه روش قبلی برای مدلسازی گل های مورد انتظار همه کارهای خوبی برای تخمین تعداد گل های مورد انتظاری که یک تیم باید در طول بازی یا در کل فصل بزند انجام داده اند. اما متغیرهای دیگری هم وجود دارد که در فرصت بالقوه‌ی گلزنی نقش دارند.

برخی مدل ها بجای اینکه مقدار xG را فقط بر اساس مکان پرتاپ شوت به آن اختصاص دهند به چگونگی ایجاد فرصت شوت زدن هم توجه میکنند (برخورد، توپ مستقیم، ضد حمله، و غیره) و نحوه‌ی پرتاپ شوت را با جزئیات بیشتری تجزیه و تحلیل میکنند.

فوتبال فقط حمله نیست. موقیعت دفاعی و کاهش شانس رقیب برای گل زنی هم اهمیت دارد – مدافعان میتوانند کاری کنند که بازیکن مجبور شود از راه دیگری شوت بزند و یا دقیقه های آخر را مدیریت کنند تا گلزنی سختتر شود.

علاوه بر تجزیه و تحلیل کل فرآیند حمله – از چگونگی ایجاد یک شانس گرفته تا مکان عمل نهایی -، استفاده از نزدیکی مدافعان و اینکه چگونه روی کیفیت شوت اثر میگذارد هم سطح دیگری است که در مدلسازی گل های مورد انتظار باید مورد توجه قرار گیرد.

این بدان معناست که نگاه کردن به موقعیت دروازه بان و مدافعان و مکان پرتاپ شوت میتواند باعث دقیق ترین نتیجه گیری در مدلهای گلهای مورد انتظار شود.

کدام نوع مدل گل های مورد انتظار از همه دقیق تر است؟

اکنون که می دانیم مدل های گل های مورد انتظار متفاوت چگونه کار می کنند ، می توانیم تحلیل کنیم که کدام روش دقیق ترین نتیجه ها را تولید می کند. در جدول زیر تفاوت گل های واقعی برای هر تیم از لیگ برتر 2016/2017 و تفاوت گل های مورد انتظار به دست آمده با استفاده از مدل های مختلف گل های مورد انتظار که پیشتر در مورد آنها صحبت کردیم آمده است.

Difference

Model 3 xGD

Difference

Model 2 xGD


Difference

Model 1 xGD

Actual GD

تیم

17.61-

15.39+

16-

17+

20.5-

12.5+

33+

آرسنال 

1.76-

13.76-

3-

15-

5.20+

6.80-

12-

بورنموث 

4.12+

38.88-

8

35-

9.20+

33.80-

43-

هال سیتی 

5.06+

21.06-

10-

26-

3.20-

19.20-

16-

برنلی

20.09-

31.91+

21-

31+

26.10-

25.9+

52+

چلسی

6.95+

6.05-

8

5-

11.50+

1.50-

13-

کریستال پالاس

16.18-

1.82+

17-

1+

13-

5+

18+

اورتون

9.44

30.56-

14

26-

12.60+

27.40-

40-

ساندرلند

8.35+

6.65-

8

7-

7.40+

7.60-

15-

لستر

4.13-

31.87+

3-

33+

10.7-

25.30+

36+

لیورپول

10.13+

51.13+

3+

44+

0.80+

41.80+

41+

منچستر سیتی 

4.48+

29.48+

1-

24+

0

25+

25+

منچستر یونایتد

3.54+

22.16-

7+

25-

5+

21-

26-

میدلزبورو

15.15+

8.15+

15+

8+

13.60+

6.60+

7-

ساوتهمپتون 

15.45+

0.45+

13+

2-

14.40+

0.6-

15-

استوک سیتی

2.34-

27.34-

5+

20-

3.30+

21.70-

25-

سوانزی

28.96-

31.04+

30-

30+

27.50-

32.50+

60+

تاتنهام

11.86+

16.14-

15+

13-

15.80+

12.20-

28-

واتفورد

0.52+

8.52-

1+

7-

3.80-

11.80-

8-

وست برومیچ

7.17+

9.83-

10+

7-

5.9+

11.10-

17-

وستهام

بهترین راه برای ارزیابی صحت هر یک از این روشها ، یافتن انحراف مربع میانگین ریشه (RMSD) است – گاهی اوقات به آن خطای مربع میانگین ریشه (RMSE) هم گفته میشود. اینکار با جذر گرفتن از تفاوت گلهای واقعی و گل های مورد انتظار برای هر تیم انجام میشود، و پس از محاسبه‌ی میانگین، ریشه‌ی جذر آن میانگین پیدا میشود.

مدل 3 xGD

مدل 2 xGD

مدل 1 xGD

12.01

12.55

12.92

RMSD

همانطور که مشاهده می کنید ، سه رویکرد متفاوت از لحاظ خروجی تولید شده برای تفاوت گل های مورد انتظار در فصل لیگ برتر 2016/2017 بسیار مشابه هستند – فقط 0.91 RMSD این سه مدل را که سطوح داده‌های مختلفی دارند از هم متمایز میکند.

اما، یک فصل (380 بازی) آنقدر بزرگ نیست که بتوان با قطعیت ادعا کرد کدام روش بهتر از دیگری است. همچنین، محاسبه‌ ی RMSD بر مبنای مسابقه به مسابقه با وضوح بیشتری دقت هر مدل را نشان می دهد و همچنین مشخص می کند که این مدل ها در پیش بینی تعداد گل ها در یک مسابقه چقدر با هم شباهت دارند.

ایا میخواهید در مورد گل های مورد انتظار بیشتر بدانید؟

اگر میخواهید اطلاعات بیشتری در مورد گلهای مورد انتظار داشته باشید و از این دانش در شرط بندی های خود استفاده کنید، میتوانید به نوشته‌های اندرو بیزلی در مورد اینکه این معیار چه کاربردی در شرط بندی لیگ برتر دارد استفاده کنید.

___________________________________

منبع مقاله : پیناکل
ترجمه اختصاصی از فوتبالی

____________________________________