Почему нельзя доверять продвинутым рейтингам

Разговоры о баскетболе изменились. Исследовать реальность охотников все меньше, куда заманчивей окопаться в уютном мирке цифр и формул. Массив данных пухнет с каждых годом, математические вузы выпускают счетоводов/аналитиков, а тех хлебом не корми – дай все систематизировать и выстроить по ранжиру. Было бы забавно увидеть аналитику по матчу «Олимпиакоса» и ЦСКА в 1995-м, когда половину состава армейцев отравили психотропным веществом. Думается, защитный рейтинг москвичей был ни к черту. А как насчет «Голден Стэйт» без Дюранта, Томпсона и Игудалы? Подарок судьбы, богатейшая фактура. Можно выставить Карри никчемным показушником и уйти безнаказанным, красота.

Командные метрики не учитывают травмы, конфликты с тренером и приступы камерунской диареи, но производительность клуба оценивают без прикрас. Количество забитых/пропущенных очков на 100 владений, расчеты темпа, эффективного процента с игры (EFG%) – полезные штуки, удобно отсеивать зерна от плевел, видеть разницу между «Никс» и «Милуоки». Вдумчивый просмотр матчей и продвинутая статистика помогает принять верное решение, доказывать нечего, пройденный этап.

С индивидуальными рейтингами ситуация резко хуже. Засоряют эфир. Их приводят в сравнениях игроков разных лет, строят подобие анализа, дурят головы неофитам. Представьте, человек с улицы увлекается НБА, а на него вываливают телегу, что игрок Х полная туфта. Мол, PER как у лавочника БК «Астана», BPM Джереми Лина, отрицательный WS и VORP. Немудрено стушеваться и поверить в авторитет хитро выструганных формул, ссылкам на ESPN и Basketball-Reference.com, мекки аналитиков-самоучек.

Прогуляемся по модным рейтингам и убедимся, что прока от них, как от Дэвида Фицдэйла на латвийской границе. С какой заразой боремся? На повестке четыре головы аналитической гидры.

PER (Player Efficiency Rating), он же Рейтинг эффективности

Рейтинг эффективности придумал автор ESPN Джон Холлингер. Холлингер – не чуждый НБА персонаж, отработал в лиге больше двух десятилетий, семь сезонов вице-президентом «Мемфиса». Джон одним из первых препарировал цифры в «продвинутой» манере. В конце 90-х принялся публиковать анализы в Интернете (тогда сеть была мирком технарей и упоротых всех мастей), выпускал ежегодный статистический журнал Basketball Prospectus. Холлингер отказался от привычных очков/подборов/передач «за матч» в пользу «минут». Значимость подхода трудно переоценить, в наши дни расчет на владения и минуты стал нормой. Джон сочинил массу персональных рейтингов, самым популярным стал PER.

Переписывать формулу бессмысленно. Гуманитарный мозг не переварит, а любители матана могут лично отправиться на Basketball-Reference и упиваться бесконечными переменными. Главное, PER рассчитывается на базе старых добрых очков, забитых мячей, трехочковых, подборах и прочих радостях, но добавляет в рецепт средние показатели по команде и лиге, плюс выравнивающий коэффициент за игровой темп. Автор рейтинга не скрывает – PER слабо оценивает защитников, только по перехватам и блокам.

Косяки PER несложно заметить, по нему Нерленс Ноэл равен Крису Полу, Кристиан Вуд полезнее Брэдли Била. Несмотря на спорный результат, PER стал ходовым инструментом в руках баскетбольных гиков. Высочайший PER в истории имел Уилт Чемберлен в 1963-м году – 31,82.

WS (Win Shares), он же Доли побед

«Доли побед» – так называлась книга знаменитого бейсбольного аналитика Билла Джеймса. Именно на трудах Джеймса менеджер «Окленд Эйсес» Билли Бин создал команду, прославленную книгой Moneyball и фильмом «Человек, который изменил все» с Брэдом Питтом. По задумке автора, каждая победа бейсбольной команды делится на условные три доли победы. Поровну, как апельсин. С помощью формул и божьей матери доли распределяют между игроками, оценивая вклад в общий котел. Кто больше победных долек заслужил, тот красавчик.

Адаптировать WS к баскетболу сумел именитый статистик, создатель сайта Basketball-Reference Джастин Кубатко. Он не только выдавал креатив в интернетах, а работал в реальной НБА. С 2008-го по 2011-й Джастин служил консультантом по статистике в «Портленде», в 2014-м НБА наняла его, чтобы запилить софт для обработки той же самой статистики.

Кубатко отказался от деления побед на три куска, для него одна победа – одна доля. Также, в отличие от бейсбола, Джастин допустил существование негативных долей побед. Что вполне разумно, если вдуматься – не каждый игрок приносит пользу, от некоторых больше вреда (привет Айзее Томасу!). Доля победы складывается из атакующей и защитной доли. Атакующая считается из показателя Принесенных очков (Points produced) и количества владений. Как считаются принесенные очки? Суровый матан из забитых мячей, ассистов и подборов на чужом щите.

С защитными долями проще, извлекаются из защитного рейтинга игрока. Полученные числа пропускают через сито корректировок на средние количества владений, темпы и рейтинги. На выходе дистиллятор отмеряет вклад баскетболиста. Абсолютный рекордсмен по WS – Карим Абдул-Джаббар 1972 года, 25,37 долек.

Аномалии WS этого сезона – 4-е место Руди Гобера в общем рейтинге при 38-м Донована Митчелла. Говорят, ссора Донована и Руди вовсе не из-за коронавируса случилась. Кто-то скинул Митчеллу ссылочку на баскетреф, вот и бомбануло. Другие улетные приколы – Джаретт Аллен выше Джоэла Эмбиида, Митчелл Робинсон превзошел Николу Вучевича. Келли Олиник принес «Майами» больше побед, чем Кендрик Нанн – вот Споэльстра удивится!

BPM (Box Plus-Minus), Продвинутый показатель полезности

Даниэль Майерс родился в городе Норман, Оклахома, в семье аптекаря. Закончил университет, получил степень по структурному анализу. Трудился в департаменте транспорта, конструировал мосты, инспектировал стройки. Дневные дела Майерса важны жителям Оклахомы, ночные – баскетбольным аналитикам. В свободное время Даниэль заседал на форуме APBRmetrics, пристанище цифровых маньяков, где продвинутыми методами оценивают вклад Пиппена в чемпионства «Буллс» и чинят игру «Никс» переводом Бобби Портиса в старт.

Плавильный котел аналитических идей тихонько булькал, прорыв случился в 2014-м. Первой ласточкой в реформе показателя полезности стал аналитик «Финикса» Иеремия Энгельманн. Немец уволился из «Санс», обосновался на ESPN, где предложил новую метрику, реальная полезность (Real Plus-Minus, RPM). Цель – нивелировать фактор «крутого партнера», чтобы парень, которому повезло играть с условным Яннисом/ЛеБроном не собирал зверские плюсы чужими руками. Энгельманн пересчитал полезность на 100 владений и разделил атакующие/защитные владения. Простыми очками не ограничился, а запихнул в расчеты все существующие показатели, от подборов до возраста. Качество работы не осталось незамеченным, в 2019-м Иеремию приняли в «Даллас» старшим аналитиком.

Майерс пошел дальше, скрестил традиционную статистику с продвинутыми рейтингами и назвал новорожденную чуду-юду BPM. Новинкой стали позиционные коэффициенты. По замыслу Даниэля, разыгрывающий отвечает за креативность (организатор), а дело бигменов (принимающих) – запихивать мячик в корзину с метких передач. В лиге с Йокичем и Грик Фриком говорить о позициях моветон, и все же BPM нашел путь в сердца, очень уж солидно и продуманно смотрится.

Рекордный BPM в истории несколько лет держал Расселл Уэстбрук 2017-го года, но в феврале этого года Майерс поменял формулу, чтобы не поощрять хиробол. Новый чемпион BPM – ЛеБрон 2009-го, следом за ним Джордан-88, Стэф Карри-2016 и Дэвид Робинсон образца 1994-го. Что до прошедшего сезона, приколов хватает. Дружок Янниса Донте ДиВинченцо оказался полезней Джейлена Брауна, лучший запасной лиги Деннис Шредер не годится в подметки Делону Райту, Стивен Адамс играючи рвет единорога Порзингиса. Цирк, да и только.

VORP (Value Over Replacement Player), Полезность относительно игрока замены

VORP пришел к нам из бейсбола, как и WS. В конце 90-х метрику предложил математик и фанат «Бостон Ред Сокс» Кейт Вулнер. Выпускник Массачусетского технологического института после учебы бился над стартапом в Силиконовой долине, но вскоре понял, что бейсбольные цифры занимают его больше, чем проектирование софта. Девять лет Вулнер писал для аналитического журнала Baseball Prospectus, с 2007 работает боссом по аналитике в клубе MLB «Кливленд Индианс».

Кейт исходил из того, что в бейсболе мало суперзвезд, много «середняков» и хоть лопатой загребай «шлака». «Игрок замены» по Вулману – бестолковый парень на дне пищевой цепочки, который сидит за минимальную зарплату в любой команде. Если поставить его в старт, сыграет лучше или хуже, но средний уровень ясен. VORP оценивает, насколько игрок полезнее, чем случайный иванушка-дурачок.

У адаптации VORP для баскетбола не было одного отца, хотя Даниэль Майерс пробегал мимо. Безумцы-аналитики сломали сотни копий на форумах, пока не решили – игрок замены в баскете должен иметь BPM минус 2. Почему 2, а не 3 или 1? Да хрен его знает, верить или нет – дело хозяйское.

Нехитрый расчет определяет полезность на 100 владений в сравнении с условным «Мело», который наденет вашу майку за миску риса. Из-за привязки к BPM, исторические рекорды VORP очень близки. Джордан-88 и ЛеБрон-09 впереди планеты всей, Робинсон также рядом, зато сезон Карри-2016 из топа вывалился.

Чем веселит VORP в реальном мире? По нему Дариус Гарланд – худший игрок НБА, 514-й в рейтинге, днищенское дно. Гарланд – продукт сырой, а то и бракованный, но хуже всех? Рейтинг не любит Кайла Кузму и Эрика Паскалла, парням пора в Китай. Случайный запасной «Чикаго» Шакил Харрисон дает прикурить Коллину Секстону, опозорившийся француз Батюм смотрится солидней хайпового Тайлера Хирро. Невозможно воспринимать всерьез, слишком жесткое расхождение с реальностью.

Если взять все метрики разом, истина откроется?

Увы, количество курьезов не уменьшается. Для финальной казни подберем две полные пятерки чисто по продвинутым меркам. Оговорка: пул для набора игроков ограничен 193 ребятами, которые попали в рейтинги PER и BPM (резервистов в расчет не берем, только железные игроки ротации).

Первая команда набрана среди худших по продвинутой статистике, назовем ее «Сборная Ай-Теста».

Воскресший Маркелл Фульц не убеждает математиков, хотя близок к попаданию в защитную пятерку, диктует удушающий темп «Орландо» и по-здоровому агрессивен. Формулы неумолимы. 241-й в лиге по VORP, любой дворовый Вася справился бы лучше.

Диллон Брукс напрасно тащил «Мемфис» в зону плей-офф, наковырял всего 1,0 WS. Сосед Диллона по подвалу рейтинга VORP – Ар Джей Барретт. Пока публика восхищается смелостью и атлетичностью таланта «Никс», BPM рисует жуткие -4,3. PER добивает с ноги, 173-й в НБА.

Пи Джей Вашингтон закрепился в старте бедового «Шарлотт». В активе новичка цепкость, уверенная работа корпусом, периодический дальний бросок. Пи Джей ровно приносил пользу весь сезон, да так и не впечатлил ни одну из хитроумных метрик. 255-й BPM в НБА, остальное не лучше. Картер-младший играл неровно, мучался травмами, хотя держал марку, собирал стабильный дабл-дабл. В хаосе тренера Бойлена надеяться на большее наивно. 360-й VORP выглядит как приговор.

Вторая пятерка зовется «Мечта аналитика», в ней обитают парни, которые превосходят игроков «Ай-Теста» по четырем продвинутым параметрам.

Смотрите, как легко мусорная стата дурит рейтинги. Алек Беркс насобирал халявы в «ГСВ», получите-распишитесь, 86-й игрок НБА по PER. Его партнер по задней линии – Тайус Джонс, запасной разыгрывающий «Мемфиса». Джонс приносит «мишкам» подлинную пользу, выше среднего по BPM, солидный VORP, сносный WS.

Заглянул недавно в словарь синонимов, искал варианты к слову «посредственность». Там была напечатана фотография Микела Бриджеса. Про таких, как Бриджес, Иоанн Богослов писал: «Знаю твои дела, ты ни холоден, ни горяч; о, если бы ты был холоден, или горяч!» (Откр. 3:15). Высматривать Микела на паркете приходится с лупой, но VORP, BPM и WS уверены – это один из столпов «Финикса». Из-за невзрачных цифр в атаке у Бриджеса вялый PER, зато выше Барретта.

Маркиз Крисс растратил талант, ничтожество в кубе, дурилка картонная. Усмешка творца подарила Криссу место в старте «Уорриорз», тот и покуражился. Согласно PER, пассажир из Сан-Франциско 43-й игрок НБА. Если бы участников Матча всех звезд набирали по продвинутой стате, Маркиз мог проскочить, жуть.

Ларри Нэнс – единственный в «аналитической» пятерке, кого не стоит скармливать свиньям. Центр «Кливленда» – случайный заложник BPM и PER, они вынесли Ларри непомерно высоко. Нэнс полезный игрок, который не имеет права быть лучше Картера, разные касты.

Кому верить?

Статистика не способна на обман, цифры лишены эмоций. Лукавство не в рейтингах, а в их оценке. Неспроста авторы метрик получали работу в лиге, их главный скилл – обработка данных, поиск закономерностей, отсев совпадений. Проблемы возникают, когда статистику ставят во главу угла, игнорируя ее объективную ущербность. Когда приводят удобные факты, набрасывают чисел в пользу любимчика или предвзято топят фаворита публики.

Ни VORP, ни PER не годятся для сравнения Леброна с Джорданом. Фантазии останутся фантазиями, нам не дано узнать, как Чемберлен сыграет в лиге победивших «пулялок». Кобе Брайант останется сыном 90-х, продвинутые расчеты не отыщут истину, лишь добавят тумана. Единственный путь к трезвости – смотреть игры. Только ай-тест не позволит поддаться учениям цифровых лжепророков и уверенно держаться под струей анализов.