golos_dobra (golos_dobra) wrote,
golos_dobra
golos_dobra

Лучшие прогнозы на основе машинного обучения для чемпионата мира

Это единственный публичный случай, когда на сегодняшний день самые современные методы машинного обучения использовались с результатами, публично раскрытыми перед реализацией.

Не путайте это с обычным шумом, подобным Стэнфорду, где рудиментарные методы ML используются для простых, известных случаев с большим успехом.

Здесь мы можем взглянуть своими глазами, насколько наилучшим образом передовые методы ML способны делать реальные прогнозы.

https://www.technologyreview.com/s/611397/machine-learning-predicts-world-cup-winner/

Ну, из восьми пар они правильно предсказали всего три: COL-ENG, URU-POR и EPS-RUS.
Гораздо хуже этого, они предсказали, что ГЕРМАНИЯ выиграет Кубок.

+++

Интересно также добавить, что допустим предсказать не только исход матча, но и точный счет
можно довольно легко для первых двух раундов, но не для третьего.
Третий наиболее сложно формально предсказать.

Т.е. конкретно, допустим по максимуму за раунд можно набрать сто очков, если точно
предсказать не только исход матча, но и счет.
Так вот для первых двух раундов, допустим, выходит 62 и 63, а вот для третьего - резко 41, да и
то в основном из-за точно предсказанного результата матча Панама-Тунис,
который вообще никакого стратегического значения не имел.

Характерно, не правда-ли? Очевидно, что стратегические динамически раскрывающиеся
соображения действительно реально и существенно влияют
на результат матчей ИМЕННО третьего раунда.

И “одновременность” матчей вовсе не избавляет от проблемы стратегической координации исходов.
А уж что будет в штатах, когда вообще немыслимый формат матчей будет введен...
Там уж без стратегии просто никак с тремя командами в групповом турнире.

Это на самом деле куда интереснее, чем просто футбол.
Тут серьезно думать надо.

Ну а пока, действительно лучшая работа по теме с использованием ML
довольно показательно тыкнула пальцем в небо

https://arxiv.org/pdf/1806.03208.pdf

The same three teams are determined as the major favorites by a group of experts of the Swiss bank UBS, but with different probabilities and a different order (Audran, Bolliger, Kolb, Mariscal, and Pilloud, 2018): they obtain Germany as top favorite with a winning probability of 24.0%, followed by Brazil (19.8%) and Spain (16.1%). They use a statistical model based on four factors that are supposed to indicate how well a team will be doing during the tournament: the Elo rating, the teams’ performances in the qualifications preceding the World Cup, the teams’ success in previous World Cup tournaments and a home advantage. The model is calibrated by using the results from the previous five tournaments and 10,000 Monte Carlo simulations are conducted to determine winning probabilities for all teams.

...

Figure 3 shows the corresponding bar plots for the variable importance of the single predictors. Interestingly, the abilities are by far the most important predictor in the random forest and carry clearly more information than all other predictors (see also Figure 2). In the following section, this model will be applied to (new) data for the upcoming World Cup 2018 in Russia to predict winning probabilities for all teams and to predict the tournament course.

+++

То есть, люди в упор видят “талант” как главный фактор, но все равно не понимают
что талант штука переменная и не обязательно чисто стохастическая, а находится
в прямой, жестко определенной связи согласно самому базовому постулату экономики со стимулами,
как экзогенного, так и эндогенного характера.

Но этого, собственно, никто из физтехов и айтишников, работающих над разными там риск моделями
в банках и индустрии, не понимает и не умеет толком делать.

И это есть главный и наиболее опасный бич всех современных хайпов на тему машинного обучения,
которое да, умеет различать кошек и собачек, а также выявлять дефекты в микросхемах, что
тривиально просто. Но все эти методы разбиваются как попытки американцев исследовать Венеру при
применении ML к делам социальным, с участием разумной жизни.

https://www.theatlantic.com/science/archive/2017/01/venus-lost-generation/513479/

With so much to learn on a planet so close to Earth, why, then, has NASA halted Venus exploration?

https://en.wikipedia.org/wiki/List_of_missions_to_Venus

Казалось бы, какая связь между этим и объявленной реформой пенсионной системы в России?
Физтехам, блуждащим в законе итеративных ожиданий, отдельный вопрос, конечно, но не будем о грустном.

Главное тут что понять?
Главное тут понять, что эта реформа в нынешнем ее виде безусловно стимулирует дальнейшее
и очень сильное расслоение населения на три резко разных класса, практически подвидов одной
и той же человеческой популяции:

1) люди служивые, нулевые, которые все делают по уставу и которым все без разницы;

2) люди минус-минусовые, еще более активно вымирающие досрочно раз никаких шансов зацепиться на этом
свете отдохнув чуток от типичного российского ада работодателей хоть на пенсии,
люди и так нищие, вынужденно берущие на себя все больше риска с повышенным шансом
покинуть досрочно эту юдоль;

3) люди плюс-плюсовые, с рождения благополучные, и еще более активно работающие над своим здоровьем и ценящие его достаточно,
чтобы избавиться от вредных привычек и занятий - высший, наиболее процветающий
и успешный класс всегда и везде с минимумом риска и максимальной продолжительностью жизни

Все остальное можно обсуждать в деталях, этот же вывод несомненен.

И дальше как в футболе, пожалуйста, предсказывайте исход матчей,
кому в итоге достанется кубок.

Но при этом надо понимать, что бежать жизненный
марафон как спринт, выкладываясь в первые годы жизни в ущерб последним,
чревато смертью досрочно.

Кстати, видеть процент людей плюс-плюсовых в сравнении с прочими по планете
можно легко в Таблице 1 из сильно недооцененной на сегодняшней день статьи:

https://epjdatascience.springeropen.com/articles/10.1140/epjds/s13688-016-0091-3

Для России плюс плюсовиков стало 9.5 процентов в более последние годы, было 12.3
для Израиля тринадцать как было, так и есть с легким трендом вниз
для Германии одиннадцать как было так и есть с легким трендом вниз
для Великобритании тоже одиннадцать, с легким трендом вверх
для штатов с десяти выросло до двенадцати
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic
  • 40 comments