Hay otra probabilidad media

Algoritmos, fórmulas, estadísticas...
Avatar de Usuario
PacoHH
15
15
Mensajes: 21149
Registrado: Lun 20 Oct, 2003 8:03 pm
Ubicación: Almería
Contactar:

Hay otra probabilidad media

Mensaje por PacoHH »

Por fin empiezo a contar lo que quería desde un principio, ya hace meses, ya era hora. Esto es como El Señor de los Anillos.

Hay otra probabilidad media que me gusta más, por eso la he dejado para el final.

Se trata de la probabilidad media de las 4.782.969 columnas, como en cada partido la tercera parte de los signos es un “1”, otra tercera una “X” y otra tercera un ”2”, se calcula así.

Los porcentajes (probabilidades) de los tres signos de cada casilla se multiplican por 1/3 y se suman, se repite 14 veces y se multiplican los 14 resultados, esa es la media de las probabilidades de las 4.782.969 columnas.

Le ocurre como a la otra probabilidad media que expliqué pero al revés, cuando la jornada es difícil la media de las probabilidades es más alta que cuando es de fácil pronóstico, que resulta bastante más baja.

Me gusta más porque permite analizar muy detalladamente la distribución de TODAS las apuestas según su probabilidad (la que le da el apostante), eso es lo que he hecho y el resultado es sorprendente.

Los logaritmos neperianos de todas las probabilidades de todas las columnas de cualquier semana tienen siempre una distribución normal.

Cuando una semana es de fácil pronóstico, la media es muy baja con una desviación típica ancha, el espectro de las probabilidades se abre mucho y llega a haber columnas con una probabilidad bajísima y en una banda determinada de probabilidades hay menos densidad de columnas.

Cuando una semana es de difícil pronóstico, la media es más alta con una desviación típica más estrecha, el espectro de las probabilidades se encoge y en una banda determinada de probabilidades hay mayor cantidad de columnas.

Esto quiere decir que se puede calcular con bastante precisión cuántas columnas hay entre dos probabilidades sin necesidad de calcularlas todas una por una y quedarse con las que lo cumplan.

Se conoce la densidad de apuestas según su probabilidad con sólo saber su media y su desviación típica.

Todo esto se entiende mejor con gráficas, a falta de gráficas voy a ver si preparo un ejemplo en el que se junten esta distribución normal con la que expliqué en “un regalo…todo el poder en tus manos” cuando dije que la cosa se complicaba…..

Juntando las dos distribuciones normales queda al descubierto el secreto mágico de la quiniela del que hablaba Pinfly.
Avatar de Usuario
Felix Perez
12
12
Mensajes: 1620
Registrado: Mar 28 Oct, 2003 6:52 pm
Ubicación: Madrid
Contactar:

Mensaje por Felix Perez »

Paco, como siempre excelente!!!


Estamos impacientes por saber...., ¿como calcular cuantas columnas hay entre dos probabilidades? ¿Como calculamos la densidad de apuestas, con la probabilidad, la media y la desviacion?
Avatar de Usuario
Felix Perez
12
12
Mensajes: 1620
Registrado: Mar 28 Oct, 2003 6:52 pm
Ubicación: Madrid
Contactar:

Mensaje por Felix Perez »

Paco,

Se pueden poner imagenes, lo digo por lo de las gráficas, lo que ocurre es que hay que subirlo a un servidor de Internet, bien al de esta web o a otro.

Si tienes las gráficas en formato GIF, por ejemplo, me las envias y las publicamos, probamos a sacarlas por aki.

Ejemplo: Imagen
Avatar de Usuario
PacoHH
15
15
Mensajes: 21149
Registrado: Lun 20 Oct, 2003 8:03 pm
Ubicación: Almería
Contactar:

Minería de datos aplicada

Mensaje por PacoHH »

Estoy empezando a leer lo que me recomendó DoctorPi sobre el tema y el concepto ya lo he medio pillado. Hay tanta información que el problema es procesarla adecuadamente..

En lugar de ponerme a escribir fórmulas que dejen la cosa bastante oscura, que lo dejaré para mas adelante, voy a poner un ejemplo aproximado pero que creo que se entenderá mejor.

Quiero dejar bien claro antes de empezar que yo no me invento nada, lo único que voy a hacer es procesar una información que está al alcance de todo el mundo, con mi pico de minero sólo arranco datos.

Voy a trabajar con la quiniela de esta próxima semana 19. Los únicos datos que necesito son los porcentajes del concurso, me he copiado lo que había cuando habíamos concursado 161 participantes, yo he sido el 161. Hasta ahora el pronóstico está siendo algo difícil, la probabilidad media es 6,0685e-6 aunque conforme participen más concursantes irá subiendo como casi siempre.

¿Qué he hecho?, he tomado la columna más fácil y la mas difícil y he calculado sus probabilidades, son estas:

1111X21111X1X1 = 1,02543887e-4 y su logaritmo neperiano –9.18521968
XX221122222212 = 4.24467488e-12. y su logaritmo neperiano es –26.18535588

El planeta más grande es 24.158.243 veces más grande que el más pequeño. Y eso que es una semana difícil de pronosticar y los extremos se acercan.

Entre esos dos extremos están todas las columnas. He dividido el intervalo que hay entre los dos logaritmos neperianos en 45 partes iguales y he tenido la santa paciencia de calcular cuántas columnas del pronóstico de esta semana hay en cada intervalo o celda.

LNPRMIN indica el valor mínino de la celda, o sea que sólo hay 7 apuestas con un valor superior a –9.4014377, entre este valor y –9.7871883 hay 84 columnas….

En “COLUMNAS” está claro lo que hay, ¿verdad que ya se adivina una distribución normal?, la columna siguiente PMEDIACONCURSO es la probabilidad media de todas las columnas de esa celda calculada con los porcentajes del concurso.

Para calcular “REAL” me he ido a mi fichero REAL, he oredenado las 506 semanas por orden de probabilidad del “14” (Columna M) y he puesto en cada celda las columnas que he encontrado.

% es el cociente entre el número que aparece en la casilla y 506, en la celda 8 es 18/506= 0.03557312, es un cálculo aproximado de la probabilidad real que tiene el “14” de caer en esa celda.

PMEDIAREAL es POR FIN la probabilidad media REAL de cada una de las columnas de la celda calculada como el cociente entre “% / columnas”

Premio es lo que cobra un 14 de media cuando cae en esa celda, está calculado como 0,075 / PMEDIACONC.

Y finalmente la esperanza es el producto de la probabilidad real por el premio, osea el producto de sus dos casillas anteriores.

Conclusión bastorra y sin pulir, entre las celdas 18 y 23 están las apuestas rentables. 1.203.500 apuestas.

CELDA__LNPRMIN___COLUMNAS__PMEDIACONC____REAL____%________PMEDIAREAL_______PREMIO____ESPERANZA
___1___-9,4014377_______7___0,000100178_______3__0,00592885___0,000846979______748,67____0,63410591
___2___-9,7871883______84___6,8115E-05________1__0,00197628___2,35272E-05_____1.101,08____0,0259053
___3__ -10,1729389_____372__4,63141E-05________1__0,00197628___5,31259E-06_____1.619,38____0,00860309
___4__ -10,5586895____1.094__3,14908E-05_______4__0,00790514___7,2259E-06_____2.381,65_____0,01720954
___5__ -10,9444401____2.497__2,14119E-05______12__0,02371542___9,49756E-06____3.502,73_____0,03326739
___6__ -11,3301907____4.793__1,45588E-05_______4__0,00790514___1,64931E-06____5.151,53_____0,00849646
___7__ -11,7159413____8.261__9,89911E-06______10__0,01976285___2,39231E-06____7.576,44_____0,01812517
___8__ -12,1016919___13.194__6,7308E-06_______18__0,03557312___2,69616E-06____11.142,81____0,03004278
___9__ -12,4874425___19.978__4,57654E-06______11__0,02173913___1,08815E-06____16.387,92____0,01783258
__10__ -12,8731931___28.632__3,11177E-06______21__0,04150198___1,4495E-06____24.102,01_____0,03493578
Avatar de Usuario
PacoHH
15
15
Mensajes: 21149
Registrado: Lun 20 Oct, 2003 8:03 pm
Ubicación: Almería
Contactar:

Minería de datos aplicada

Mensaje por PacoHH »

Como no ha cabido entero (me lo temía) aquí continúa.

CELDA__LNPRMIN___COLUMNAS__PMEDIACONC____REAL____%________PMEDIAREAL_______PREMIO____ESPERANZA
___1___-9,4014377_______7___0,000100178_______3__0,00592885___0,000846979______748,67____0,63410591
___2___-9,7871883______84___6,8115E-05________1__0,00197628___2,35272E-05_____1.101,08____0,0259053
___3__ -10,1729389_____372__4,63141E-05________1__0,00197628___5,31259E-06_____1.619,38____0,00860309
___4__ -10,5586895____1.094__3,14908E-05_______4__0,00790514___7,2259E-06_____2.381,65_____0,01720954
___5__ -10,9444401____2.497__2,14119E-05______12__0,02371542___9,49756E-06____3.502,73_____0,03326739
___6__ -11,3301907____4.793__1,45588E-05_______4__0,00790514___1,64931E-06____5.151,53_____0,00849646
___7__ -11,7159413____8.261__9,89911E-06______10__0,01976285___2,39231E-06____7.576,44_____0,01812517
___8__ -12,1016919___13.194__6,7308E-06_______18__0,03557312___2,69616E-06____11.142,81____0,03004278
___9__ -12,4874425___19.978__4,57654E-06______11__0,02173913___1,08815E-06____16.387,92____0,01783258
__10__ -12,8731931___28.632__3,11177E-06______21__0,04150198___1,4495E-06____24.102,01_____0,03493578
__11__ -13,2589437____39.319__2,11582E-06______27__0,05335968___1,3571E-06___35.447,26_____0,04810536
__12__ -13,6446943____51.980__1,43863E-06______26__0,0513834____9,88522E-07__52.132,92_____0,05153456
__13__ -14,0304449___66.747__9,78182E-07______30__0,05928854___8,88258E-07___76.672,81_____0,06810522
__14__ -14,4161955___83.023__6,65105E-07______38__0,07509881___9,04554E-07___112.764,07____0,10200123
__15__ -14,8019461__100.661__4,52232E-07______40__0,07905138___7,85323E-07___165.844,13____0,13024118
__16__ -15,1876967__118.936__3,07491E-07______38__0,07509881___6,31422E-07___243.909,91____0,1540101
__17__ -15,5734473__137.884__2,09075E-07______37__0,07312253___5,30319E-07___358.722,66____0,19023751
__18__ -15,9591979__156.472__1,42159E-07______43__0,08498024___5,43102E-07___527.579,81____0,28652959
__19__ -16,3449485__175.434__9,66593E-08______26__0,0513834____2,92893E-07___775.921,03____0,22726188
__20__ -16,7306991__193.138__6,57225E-08______27__0,05335968___2,76277E-07__1.141.160,90___0,31527708
__21__ -17,1164497__210.714__4,46874E-08______32__0,06324111___3,00128E-07__1.678.325,68___0,50371201
__22__ -17,5022003__226.541__3,03847E-08______17__0,03359684___1,48304E-07__2.468.343,50___0,36606414
__23__ -17,8879509__241.201__2,06598E-08______26__0,0513834____2,13031E-07__2.468.343,50___0,5258348
__24__ -18,2737015__253.621__1,40474E-08_______3__0,00592885___2,33768E-08__2.468.343,50___0,05770203
__25__ -18,6594521__263.350__9,55141E-09_______5__0,00988142___3,7522E-08___2.468.343,50___0,09261722
__26__ -19,0452027__269.181__6,49439E-09_______3__0,00592885___2,20255E-08__2.468.343,50___0,05436657
__27__ -19,4309533__270.862__4,41579E-09_______1__0,00197628___7,29628E-09__2.468.343,50___0,01800972
__28__ -19,8167039__267.274__3,00248E-09_______0________0____________0_____2.468.343,50_________0
__29__ -20,2024545__257.921__2,0415E-09________0________0____________0____2.468.343,50__________0
__30__ -20,5882051__243.411__1,3881E-09________1__0,00197628___8,11913E-09___2.468.343,50__0,02004079
__31__ -20,9739557__222.684__9,43825E-10_______0________0____________0_____2.468.343,50________0
__32__ -21,3597063__198.958__6,41744E-10_______0________0____________0_____2.468.343,50________0
__33__ -21,7454569__170.386__4,36348E-10_______1__0,00197628___1,15989E-08__2.468.343,50___0,02862999
__34__ -22,1312075__141.784__2,9669E-10________0________0____________0_____2.468.343,50________0
__35__ -22,5169581__111.275__2,01732E-10_______0________0____________0_____2.468.343,50________0
__36__ -22,9027087___84.570__1,37165E-10_______0________0____________0_____2.468.343,50________0
__37__ -23,2884593___59.210__9,32643E-11_______0________0____________0_____2.468.343,50________0
__38__ -23,6742099___39.756__6,34141E-11_______0________0____________0_____2.468.343,50________0
__39__ -24,0599605___23.764__4,31178E-11_______0________0____________0_____2.
Avatar de Usuario
PacoHH
15
15
Mensajes: 21149
Registrado: Lun 20 Oct, 2003 8:03 pm
Ubicación: Almería
Contactar:

Minería de datos aplicada

Mensaje por PacoHH »

Como sigue sin caber entero, aquí finaliza.

__39__ -24,0599605___23.764__4,31178E-11_______0________0____________0_____2.468.343,50________0
__40__ -24,4457111___13.550__2,93175E-11_______0________0____________0_____2.468.343,50________0
__41__ -24,8314617____6.346__1,99342E-11_______0________0____________0_____2.468.343,50________0
__42__ -25,2172123____2.904___1,3554E-11_______0________0____________0_____2.468.343,50________0
__43__ -25,6029629_____891__9,21593E-12_______0________0____________0_____2.468.343,50________0
__44__ -25,9887135_____282___6,26628E-12______0________0____________0_____2.468.343,50________0
__45__ -26,3744641______27___4,2607E-12_______0________0____________0_____2.468.343,50________0

________suma____4.782.969__________________506

Me ha costado un huevo ponerlo presentable, tengo el ordenador averiado en el servicio técnico, quizás tarde algunos días en volverme a conectar......
Avatar de Usuario
Felix Perez
12
12
Mensajes: 1620
Registrado: Mar 28 Oct, 2003 6:52 pm
Ubicación: Madrid
Contactar:

Mensaje por Felix Perez »

Impresionante e Inmenso trabajo!!!, Paco.

Esas 1.203.500 apuestas entre las celdas 18 y 23 son las rentables, las que cobrarian lo suficiente para cubrir y rentabilidar la inversión.

Las que tienen una esperanza de premio mayor o igual al 33% aprox.

Estas son las que salen 1/4 de las veces.
Avatar de Usuario
PacoHH
15
15
Mensajes: 21149
Registrado: Lun 20 Oct, 2003 8:03 pm
Ubicación: Almería
Contactar:

Mensaje por PacoHH »

Continuando con cálculos bastorros salen el:

(43+26+27+32+17+26) /506 = 0,3379446640316

el 33,79%, una de cada tres semanas.
Avatar de Usuario
grupofg
11
11
Mensajes: 403
Registrado: Lun 20 Oct, 2003 7:23 pm
Ubicación: Viladecans

Mensaje por grupofg »

Sin venir al cuento, ayer vi por la tele a Heidi Klum en una portada de revista con una camiseta que llevaba fotografiada la foto de A.Einstein que PacoHH tenía antes puesta.
A parte de este paréntesis que me hizo mucha gracia, buen trabajo Paco, y gracias por informarnos de estos datos
Avatar de Usuario
Felix Perez
12
12
Mensajes: 1620
Registrado: Mar 28 Oct, 2003 6:52 pm
Ubicación: Madrid
Contactar:

Mensaje por Felix Perez »

Observo que la celda 1 tiene una esperanza 0,63410591, superior a 0,30
¿Seria bueno cojerla tambien? además solo son 7 apuestas.
Avatar de Usuario
JoanD
12
12
Mensajes: 2657
Registrado: Vie 19 Dic, 2003 6:35 pm
Ubicación: Barcelona
Contactar:

Mensaje por JoanD »

Excelente Paco, aunque yo necesito tiempo para asimilar la "traca" final.
Entiendo las conclusiones peró quiero entender cada uno de los pasos.

He aprendido, y sigo aprendiendo, mas estadistica contigo que cuando estudié en la universidad.

Saludos
Avatar de Usuario
PacoHH
15
15
Mensajes: 21149
Registrado: Lun 20 Oct, 2003 8:03 pm
Ubicación: Almería
Contactar:

Mensaje por PacoHH »

Es verdad Félix que sólo son 7, pero es que como esta semana es difícil,en 506 semanas ha habido 3 semanas fáciles que han tenido resultados fáciles, pero eran muchas mas apuestas por ser semanas fáciles. Por eso esta semana sale una esperanza tan alta.
Avatar de Usuario
PacoHH
15
15
Mensajes: 21149
Registrado: Lun 20 Oct, 2003 8:03 pm
Ubicación: Almería
Contactar:

Mensaje por PacoHH »

Se me olvidaba, ya me funciona el ordenador.
Avatar de Usuario
PacoHH
15
15
Mensajes: 21149
Registrado: Lun 20 Oct, 2003 8:03 pm
Ubicación: Almería
Contactar:

Afinando

Mensaje por PacoHH »

Con la tabla de las 45 celdas se puede ver cómo las columnas “COLUMNAS” y “REAL” los valores crecen para luego decrecer, pero no lo hacen al mismo ritmo, sube y alcanza antes su máximo REAL que COLUMNAS, gracias a eso existen las apuestas rentables.

Las dos encierran Distribuciones Normales, la famosa campana de Gauss.

La de REAL es fija, siempre es la misma (aproximadamente), es la distribución de los logaritmos neperianos de las probabilidades los premios de 14 que van apareciendo semana a semana, después de 506 semanas, la semana 507 lo hará cambiar muy poco.

La de COLUMNAS varía muchísimo de una semana a otra y depende de la facilidad o dificultad del pronóstico.

Sólo hacen falta dos números para saberlo todo de una distribución normal, su probabilidad media y su desviación típica.

REAL tiene estos valores:

MEDIAREAL = -14,783545
DTREAL = 1,96627

Para entender su significado voy a dar dos datos:

MEDIAREAL + (DTREAL x 0,67) = -14,783545 + (1,96627 x 0,67) = -13,46614, su exponencial es 1,41817e-6
MEDIAREAL - (DTREAL x 0,67) = -14,783545 – (1.96627 x 0,67) = -16,100946, su exponencial es 1,0173e-7

Entre la media y la desviación típica multiplicada por 0,67 está el 25% de la población, o sea que entre las probabilidades 1,41817e-6 y 1,0173e-7 salen el 50% de los “14”, esto pasa TODAS LAS SEMANAS, es un dato que no varía

Si se calcula con los datos de la distribución del concurso las probabilidades de todas las columnas y se eligen todas las que están entre esos dos valores, se tiene un 50% de probabilidad de acertar “14” TODAS LAS SEMANAS.

Unas semanas hay mas columnas y otras menos: Si es fácil, con menos columnas se tiene ese 50%.

(Continuará)
Avatar de Usuario
PacoHH
15
15
Mensajes: 21149
Registrado: Lun 20 Oct, 2003 8:03 pm
Ubicación: Almería
Contactar:

Mensaje por PacoHH »

¿Y que pasa con las columnas del pronóstico de cada semana?

Pues que sus logaritmos neperianos también tienen siempre una distribución normal

Y según sea el pronóstico, así varía su distribución, en el ejemplo de la tabla de 45 celdas, la media y distribución típica de las columnas de “COLUMNA” ha sido:

MEDIAPROB = -18,5004
DTMEDIAPROB = 2,571

Comparado con “REAL” se ve una media más baja (MEDIAPROB es menor que MEDIAREAL) y una mayor dispersión (DTMEDIAPROB es mayor que DTREAL), esto ocurre SIEMPRE.

Con sólo fijarse un poco ya se ve algo contundente, MEDIAPROB vale –18,5004 y el mínimo de la banda del 50% del “14” vale –16,100946.

El 50% de los “14” están muy por encima de MEDIAPROB, es más, si calculo

MEDIAPROB + (DTMEDIAPROB x 0,67) = -18,5004 + (2.571 x 0,67) = -16,77783, y su exponencial vale 5,16988e-8, menor que el valor mínimo de la banda del 50% del “14” que es 1,0173e-7

Resumiendo, que el 25% de las columnas del pronóstico de la semana salen con una probabilidad superior a 5,16988e-8 y que ese 25% tiene bastante más del 50% de probabilidad de tener entre sus columnas el futuro “14” de la semana.

Normalísimo. Los números por fin "cantan"
Avatar de Usuario
PacoHH
15
15
Mensajes: 21149
Registrado: Lun 20 Oct, 2003 8:03 pm
Ubicación: Almería
Contactar:

Mensaje por PacoHH »

Otra información muy valiosa

Si la media de los 506 partidos es MEDIAREAL = -14,783545 y su exponencial 3,7982888e-7, esa es "la probabilidad de la probabilidad máxima"
Avatar de Usuario
JoanD
12
12
Mensajes: 2657
Registrado: Vie 19 Dic, 2003 6:35 pm
Ubicación: Barcelona
Contactar:

Mensaje por JoanD »

Una preguntilla Paco,

¿existe alguna fórmula para calcular las columnas que hay entre dos probabilidades? o ¿se van contando al tiempo que se procesan todas ellas?
Avatar de Usuario
Felix Perez
12
12
Mensajes: 1620
Registrado: Mar 28 Oct, 2003 6:52 pm
Ubicación: Madrid
Contactar:

Mensaje por Felix Perez »

Paco,

¿Que aplicación importante tiene la Probabilidad de la Probabilidad Máxima? en la selección de las columnas rentables.
Avatar de Usuario
PacoHH
15
15
Mensajes: 21149
Registrado: Lun 20 Oct, 2003 8:03 pm
Ubicación: Almería
Contactar:

Mensaje por PacoHH »

JoanD, Si hay una fórmula aproximada, está al caer.

Félix, esa probabílidad es la que tiene la mayor probabilidad de salir el "14" todas las semanas, no cambia. Pero no es la más rentable porque no es la esperanza máxima.
Avatar de Usuario
PacoHH
15
15
Mensajes: 21149
Registrado: Lun 20 Oct, 2003 8:03 pm
Ubicación: Almería
Contactar:

Mensaje por PacoHH »

He analizado como ejemplo vuestras columnas base para esta jornada 19 y me ha salido ésto:


________Prob______Logaritmo
Félix Pérez: 7,3e-5 -> -9,525
Marjuane: 5,89e-6 -> -12,042
Vatacolo: 4,62e-7 -> -14,587
Nano: 1,32e-5 -> -11,235
Mariosila: 7,42e-7 -> -14,114
Alcazar: 2,59e-5 -> -10,561
Gott: 5,94e-6 -> -12,034
Totem: 7,89e-7 -> -14,052
Nene10: 3,11e-7 -> -14,983
Grupofg: 1,79e-6 -> -13,233
ivax23: 2,68e-5 -> -10,527
KuBiLLaS: 6,71e-8 -> -16,517
cHeMiKal: 1,13e-6 -> -13,693
JL: 3,23e-5 -> -10,34
PacoHH: 1,92e-6 -> -13,163

Los que más se han acercado a lo que realmente sale, (-14,783545)Vatacolo y nene10, eso no quiere decir que serán los que más acierten sino que la columna que han puesto tiene la dificultad más parecida a la media de los "14" ´premiados.

Paradógicamente la columna más probable es la de Félix, pero también es la menos rentable.
Responder