– توزیع پواسون در برابر توزیع نرمال
– پیش بینی گل های پراکنده در لیگ برتر
به عنوان یک شرط بند آیا میدانید که می توانید از انحراف استاندارد برای پیش بینی نتایج شرط بندی استفاده کنید؟ در این مقاله میاموزید که انحراف استاندارد چیست؟ چطور میتوانید آن را محاسبه کنید و در شرط بندی های خودتان از آن استفاده کنید.
در مقاله قبلی، توضیح دادیم که چرا شرط بندان با توجه به اینکه تحت تاثیر داده های زمان های دورتر قرار میگیرند، نمیتوانند فقط به میانگین متکی باشند زیرا میانگین نمیتواند پراکندگی یک مجموعه از اعداد را نشان دهد.
پراکندگی را به روشهای مختلفی میتوان اندازه گرفت. یکی از این روش ها انحراف استاندارد است – مقداری که نشان میدهد ارزش یک گروه چقدر با ارزش میانه ی آن گروه تفاوت دارد. معیارهای مختلفی در اندازه گیری توزیع نقش دارند که یا مستقیما بکار گرفته میشوند و یا پارامترهایی را در تابع یا توزیع قرار میدهند.
توزیع نرمال در مقابل توزیع پواسون
برای مثال، شرط بندان از مدل توزیع پواسون برای پیش بینی تعداد گل های فوتبال هر تیم در یک مسابقهی فوتبال استفاده میکنند. اما این توزیع پواسون فقط یک پارامتر ورودی دارد – یعنی میانگین – و یک توزیع گسسته است – یعنی خروجی ها را به عنوان اعداد کل تولید میکند.
مدل توزیع پواسون میتواند مستقیما احتمال زدن یک گل را برآورد کند، اما نمیتواند احتمال گل زدن بین دقیقهی 25ام تا 30ام را برآورد کند (البته میتوان آن را بسط داد تا برای این منظور هم از آن استفاده کرد).
توزیع نرمال – توزیع گواسی یا زنگ – هم یک توزیع محبوب است. به دلایل زیادی با توزیع پواسون فرق دارد زیرا یک توزیع پیوسته است، و بر اساس دو پارامتر کار میکند: میانگین و انحراف استاندارد.
پیش بینی گل های پراکنده در لیگ برتر
برای نمونه بیایید نگاهی بیاندازیم به تفاوت گل در یک مسابقه ی فوتبال. به نظر میرسد که تفاوت گل در هر مسابقه به صورت نرمال توزیع شده است. تفاوت گل برابر است با تعداد گلهای زده شده توسط تیم میزبان منهای گلهای زده شده توسط تیم میزبان. اگر پاسخ صفر باشد یعنی نتیجه تساوی بوده است.
بیایید نگاهی بیاندازیم به داده های لیگ برتر 2013/2014:
من سیتی با نتیجه ی 7-0 بالاترین برد خانگی را در مقابل نورویچ به ثبت رساند.
برد 5-0 لیورپول در تاتنهام بالاترین برد خارج از خانه بود
میانگین اختلاف گل 0.3789 بود (میانگین و حالت = 0)
انحراف استاندارد 1.9188 بود.
از داده ها می توان چندین نتیجه گرفت. در درجه اول محبوب ترین اختلاف گل تساوی است و توزیع تقریبا متقارن است، و به نفع بردهای داخل خانه است. اما، در این مقاله میخواهیم به انحراف استاندارد بپردازیم.
محاسبهی انحراف استاندارد
توزیع نرمال از دو پارامتر (میانگین و انحراف استاندارد) برای ایجاد یک منحنی استاندارد استفاده می کند. در این مثال، 68% از توزیع در یک انحراف استاندارد دور از میانه قرار دارد، و 95% در 2 انحراف استاندارد قرار دارد.
در اینجا انتظار داریم که 68% از بازی ها با تعداد گلی بین 1.5399 – و 2.2977 گل به پایان برسند (یعنی 0.3789 + 1.9188). ماهیت پیوستهی منحنی محدودیت های خاص خودش را دارد: تفاوت گل 1.5399 – امکان پذیر نیست.
برای اینکه یک پیروزی داخل خانه را با تفاوت گل 1 برآورد کنیم، میتوان از مقدار گسستهی (کل) 1 حرکت کرد تا بتوان طیف گسستهی بین 0.5 و 1.5 را نشان داد. سپس میتوانیم برای هر مقدار تفاوتی که از میانه دارد را محاسبه کنیم، که به آن انحراف استاندارد گفته میشود.
بهترین مزیت آن این است که اکنون میتوانیم مدل توزیع نرمال را همانطور که نشان داده شده اصلاح کنیم. در این مورد، باید ناحیه ای که با سایه ی نارنجی مشخص شده را پیدا کنیم.
ناحیه ای که با سایه آبی رنگ مشخص شده و احتمال کمتر از 1 گل را نشان میدهد (یا معادل پیوستهی آن کمتر از 0.5 گل است) میتواند 52.15% باشد.
هر چند نمیخواهیم با جزئیات محاسبه کنیم، میتوانیم با صفحه گسترده ترین نرم افزار آن را پیدا کرد (در MS Excel: = (NORM.DIST (0.5, 0.3789, 1.9188, 1)) . همچنین احتمال زیر 1.5 گل برابر است با 72.05%. بنابراین انتظار داریم بین این دو مقدار 19.53٪ باشد.
در نتیجه از بین 380 بازی، برآورد کردیم که 74.22 بازی با برد تیم میزبان و اختلاف گل یک تمام شود. در واقعیت 75 بازی با این نتیجه تمام شد، بنابراین عدد پیش بینی شده خیلی به واقعیت نزدیک بود. با تکرار این مورد برای همه اختلافات گل ها، میتوانیم تعداد گل های واقعی و برآورد شده برای هر بازی را با اختلاف گل ها مقایسه کنیم.
جدول زیر نشان میدهد که اختلاف حداقل است و به نظر میرسد که توزیع نرمال توزیع خوبی بوده (چندین راه برای تست نرمال بودن وجود دارد و این توزیع با داده های 2013/14 EPL بسیار تناسب دارد.
اکنون فرض کنید که این توزیع برای فصل لیگ برتر فعلی صحیح است. پس به عنوان یک شرط بند اسپرید شاید بخواهید بدانید که احتمال برد تیم میزبان با یک یا چند گل در این لیگ برتر چقدر است؟ این اختلاف برابر با 1 – 52.52% است، یعنی 47.48%.
بدیهی است که این یک برآورد کلی است و به طور کلی در لیگ برتر کاربرد دارد نه در تیم های جداگانه – توصیه میشود که شرط بندان روی دادههای تیم های جداگانه کار کنند نه روی داده های EPL کلی.
دومینیک کورتیس استاد گروه ریاضیات در دانشگاه لستر است. و همچنین استادیار دانشگاه مالتا نیز هست. او یک آمارگیر هم هست و در تحقیقش روی تحلیل های ورزشی و همچنین مشتقات شرط بندی و مالی تمرکز دارد.
________________________
منبع مقاله : پیناکل
ترجمه اختصاصی : وبسایت فوتبالی
________________________