שמעתי את הפודקאסט של סימונס עם מארק קיובן בועידת סלואן, הועידה שהקימו בכדי לדון בסטטיסטיקה מתקדמת והשפעתה על האן.בי.איי או משהו שכזה. בעקבות הערות של קיובן שוב חשבתי על כך שהטרנד היום הוא לנפנף בסטט' ולא להבין מה זה באמת אומר על מגרש הכדורסל. קיובן התייחס לשתי סטט' כחשובות ביותר בעוד שאני חושב שהן הסטט' שצריך להיזהר בהן הכי - +/- ונירמול דקות.
יש שלל סטט' מתקדמות שאם לא מבינים את המשמעות שלהן על המגרש אפשר לקבל תוצאות מעוותות ביותר, אני אתייחס לשלוש המעצבנות אותי במיוחד. אשמח לויכוח פורה או גם לתוספת סטט' מתקדמות שיכולות לגרום למסקנות הפוכות (טור ממוצע של הולינג'ר)
1. מדד - את האמת גם מדד ה-VGM שבפורום השתמשו בו, אבל בעיקר המדד שבשימוש היורוליג. ההבדל הגדול בין השניים זה התוספת של סחיטת עבירות כאינדקס חיובי ועשיית עבירות כשלילי. תוספת העבירות גורמת לשני עיוותים שהופכים את מדד היורוליג לכלי עוד פחות אמין למדידת משחק השחקן ממדד ה-VGM. עיוות ראשון הוא שסחיטת עבירות כבר נספרת, בקליעות העונשין, כלומר אתה נותן תרומה נוספת על אותו אספקט. עיוות שני הוא שכל עבירה שעושים על שחקן נספרת כפעולה חיובית, כשלפעמים אין קשר בין יכולת השחקן לפאול שקבוצה עושה במגרש הפתוח, פאולים בדקות הסיום ושאר שריקות שלא תמיד מורות על פעולה של השחקן.
מעבר לכך יש עיוותים בשני המדדים שעיקרם ניקוד לא נכון של הקטגוריות השונות. ריב' לדוגמא מקבל נק', בדיוק אותו ערך כמו אסיסט, שלמעשה מוביל לשתי נק', בדיוק אותו ערך כמו חטיפה, או חסימה. אם רוצים לתת ניקוד על פעולות, צריך לחשוב מה התרומה האמיתית של הפעולה, לדוגמא אסיסט למשל צריך לזכות את השחקן ב-2 נק' זכות, כי הוא גרם לשתי נק' וכו'. מי שכן מתחשב בכך זה מדד ה-PER אבל שם יש עיוותים אחרים.
בכל מקרה לי יש הרגשה, שבעיקר בתקשורת, אבל גם אצל המאמנים, מספר המדד נתפש כמספר בודד שנותן תמונה שלמה על המשחק. אני אומר שהעיוותים מונעים ממנו להיות מספר משמעותי. ברור ששחקן שנתן משחק טוב יהיה לו מדד גבוה, אבל שני שחקנים יכולים להשיג את אותו מדד והתרומה שלהם למשחק לא תהיה זהה בכלל. אפשר להשתמש במדד כאיזשהו קנה מידה, אבל רק בצוותא עם נתונים אחרים, לא כנתון בודד.
2. מדד +/-. זהו המדד שהכי קל להתבחבש איתו. צריך להבין דבר אחד. המדד הזה עבור משחק בודד אומר בערך כלום. שחקן יכול להיות שותף לריצה של הקבוצה שלו בלי שהוא יתרום כלום, אבל בגלל שהוא שחקן ספסל ומקבל דקות מועטות, המדד שלו יהיה גבוה להפליא. יכול להיות שהקבוצה השניה תיקלע פתאום לרגעי משבר ללא קשר ליריבה ושחקנים מהיריבה ייהנו מכך במדד. שחקן יכול להיות מדהים, אבל שאר חברי קבוצתו לא יתפקדו ולכן הוא יקבל מדד שלילי. יש יותר מדי אקראיות בכדי להשתמש במדד הזה עבור מקרים בודדים (קיובן למשל כן דיבר עליו ככלי של משחק בודד).
מתי כן אפשר ללמוד דברים מסויימים? כמשסתכלים על מדגם גדול. לאורך עונה אפשר להפיק נתונים. לפעמים הנתונים לא חייבים להיות על שחקן בודד, אלא יותר על הרכבים מסויימים. תמיד צריך לזכור לנפות את דקות הגארבג' שלא אומרות דבר. רצוי להסתכל מול מי השחקן שיחק. אם מדובר ששחקן ניכנס ל-20 שניות להגנה, הקבוצה חטפה סל והמאמן הוציא אותו, אין באמת משמעות לכך. בקיצר, לקחת PBP להסתכל מה הייתה התוצאה בדקות שהשחקן שיחק ולהפיק מכך מסקנות זאת הדרך הבטוחה ביותר לבזבז זמן ולקבל תוצאות שלא רק שלא יעזרו לך, אלא סביר להניח שיפגעו בך.
3. נירמול לדקות - כתבתי כבר על כך בעבר. אם התפוקה בכדורסל הייתה ליניארית, אז היה אפשר לנרמל כל דבר ולהיות מאושר. מה לעשות שזה לא כך. יש מספיק משתנים שפוגעים בליניאריות של תפוקה. היד החמה למשל (נשבע לכם שאין דבר כזה), עייפות, מאמנים טיפשים שמכניסים ומוציאים שחקנים כמו בתחנת רכבת לא נידחת והקצב הפנימי של המשחק שהוא פשוט לא ליניארי. מבטיח לכם שאם תחפשו לא באינטנסיביות רבה תוכלו למצוא לפחות חמישה שחקני ספסל של 5 דקות שבנירמול ל-40 דקות לא רק צריכים להיבחר לאולסטאר אלא צריכים לקבל חוזה מקס' אתמול.
כל זה לא אומר שאי אפשר להשתמש בנירמול. הרי אנו רוצים לעשות השוואה ולגלות כמה לברון יותר טוב מקובי בלי שינפנפו לנו בכך שלברון משחק יותר דקות (פרובוקציה זולה מצידי), אנחנו רוצים לדעת כבר בינואר 2012 שג'רמי לין הוא סופר דופר תופעה ולא לחקות לפברואר (זה דווקא אי אפשר לדעת). הרעיון הוא להבין שאם רוצים לנרמל, הפער לא יכול להיות גדול מדי. צריך לחלק את הנירמול למקטעים. לא יודע להגדיר בוודאות, אבל סתם לדוגמא ניקח החלטה שרירותית שיכולה לעזור (לא מוכחת בכלל, אבל סתם דוגמא), לא מנרמלים מעל ל-20% מהדקות. כלומר, אפשר לנרמל ל-40 דקות שחקן שמשחק 34, אבל לא שחקן שמשחק 26 דקות. הוא שייך לקטגוריה אחרת, של שחקני רוטציה שאותם נמדוד בנפרד משחקני חמישיה חשובים לדוגמא. אפשר גם לנסות לנרמל אינטרוולים של משחק ברצף ולראות תרומה בהם.
ההרגשה שלי שכמו היורוהייפ (נשבע לך סאנג'י שהיה דבר כזה), כמו פדופליית התיכוניסטים, גם עכשיו יש טרנד סטט' מתקדמות שדוהר קדימה ללא אבחנה. בדיוק כמו שעל כל קובי ברייאנט או קווין גארנט קיבלנו קוואמי בראון או אדי קארי ועל כל פאו גאסול הגיע דארקו אחד, כך מחלקות הסטט' המתקדמות של קבוצות האן.בי.איי מנפקות מידע שעוזר מאד ביחד עם הרבה הרבה מאד רעש שרק פוגע.
אני חושב שכמו בבייסבול, שם הסטט' המתקדמות הפכו את דרך החשיבה על המשחק, גם בכדורסל יכולה להיות לסטט' המתקדמות השפעה מכרעת, אבל אנחנו עדיין בשלב שמנופפים לנו למשל מול הפרצוף שהפרש נק' למשל הוא הסטט' החשובה ביותר למדידת יכולת קבוצה.
_________________ "You can see my knowledge of [Dwyane Wade's] game- we were able to limit him to his season high points of 32,"
סטן ואן גנדי
|