På banan
Onsdagen tillbringades på travbanan Fornaboda i Lindesberg. Totalt sopade vi hem inte mindre än 376 kronor i vinster. Enda problemet var väl att de sammanlagda insatserna var 620 kronor. Till detta kan läggas 80 kronor i inträde och 20 kronor för en dricka. Nåja, man kan inte ha tur i allt.
Ändå gjorde vi ett försök att vara lite vetenskapliga (se bilden nedan). De ohyggliga mängder data som finns i ett travprogram har hittills varit en gåta. Men nu hade vi hittat en förklaring på nätet. Nu skulle det ljusna!
Man får i programmet för varje häst veta:
Namn, urprungsland, ålder, färg, kön, far, mor och morfar, antal starter i år, föregående år och totalt i karriären med placering 1-2-3 samt prispengar, distans och spår, rekord på kort, medeldistans, lång och autostart, totalt insprungna pengar i karriären. kuskens namn, uppfödare, ägare, fem senaste starter med kusk, bana, spår, distans, placering, tid, om hästen tävlat barfota i de tidigare starterna o s v.
Om nu alla dessa uppgifter publiceras får man väl förmoda ett de har något slags prediktionskraft. Och om så är fallet borde det ex post facto gå att belägga med en regressionsmodell. Någon professor borde väl ha gjort en sådan? Har inte Mikael G försökt sig på det?
Jag kan se ett antal problem. Vare sig man vill förutse vinnare eller plats så handlar det om en dikotom beroende variabel. Det borde m a o vara en logistisk regression. Ett annat problem är att hästarna är sorterade efter vissa kriterier i olika lopp. Vanligt tycks vara antal segrar eller totalt insprungna prispengar. Analysen borde alltså göras lopp-vis, alltså ett slags flernivåanalys. Men då tillstöter att det blir ett för litet antal fall per grupp (lopp). Alternativt kunde man kanske standardisera variablerna lopp-vis och sen bearbeta data poolat.
Vi får grunna på det över vintern.
Ändå gjorde vi ett försök att vara lite vetenskapliga (se bilden nedan). De ohyggliga mängder data som finns i ett travprogram har hittills varit en gåta. Men nu hade vi hittat en förklaring på nätet. Nu skulle det ljusna!
Man får i programmet för varje häst veta:
Namn, urprungsland, ålder, färg, kön, far, mor och morfar, antal starter i år, föregående år och totalt i karriären med placering 1-2-3 samt prispengar, distans och spår, rekord på kort, medeldistans, lång och autostart, totalt insprungna pengar i karriären. kuskens namn, uppfödare, ägare, fem senaste starter med kusk, bana, spår, distans, placering, tid, om hästen tävlat barfota i de tidigare starterna o s v.
Om nu alla dessa uppgifter publiceras får man väl förmoda ett de har något slags prediktionskraft. Och om så är fallet borde det ex post facto gå att belägga med en regressionsmodell. Någon professor borde väl ha gjort en sådan? Har inte Mikael G försökt sig på det?
Jag kan se ett antal problem. Vare sig man vill förutse vinnare eller plats så handlar det om en dikotom beroende variabel. Det borde m a o vara en logistisk regression. Ett annat problem är att hästarna är sorterade efter vissa kriterier i olika lopp. Vanligt tycks vara antal segrar eller totalt insprungna prispengar. Analysen borde alltså göras lopp-vis, alltså ett slags flernivåanalys. Men då tillstöter att det blir ett för litet antal fall per grupp (lopp). Alternativt kunde man kanske standardisera variablerna lopp-vis och sen bearbeta data poolat.
Vi får grunna på det över vintern.
Verkar knepigt det där...
SvaraRadera