edited by me:
TR;DL
TL;DR
TL;DW
----
PacoHH escribió: ↑Jue 09 Mar, 2023 8:58 pm
...el mundial no cuenta, se juega en campo neutral.
Mi pócima de miles de partidos ME sirve para verificar que cuando en BetFair Exchange se asignan unos porcentajes a partir de sus cuotas a cualquier partido en el que se jueguen más de 25.000 € por las apostantes, esos porcentajes son las probabilidades REALES de que salga cada signo.
Y nada más.
PD: eres muy osado al decir que mis enormes muestras son malas.
Las muestras pequeñas SIEMPRE tienen menor grado de fiabilidad.
---
Pues hola de nuevo... evidentemente, claro que el mundial NO CUENTA, por eso lo recalco en el mismo párrafo que hablo de parón de navidades, etc...; es obvio que aún contando esos partidos SERIAN MUCHOS MENOS que si todas las divisiones de todos los paises del mundo hubiesen seguido sus campeonatos en caso de no haber mundial; como habitualmente, usted es de lecturas superficiales, pero OTROS aún somos de leer y al menos leer el post entero; si algo tiene vos es que "detalla" sus excepciones así elegidas por si mismo, eso ya lo dijo antes y ahora..., ni supongo cuente las finales de copa o europa por su mismo y ¿arbitrario? criterio de ignorar los partidos en campo neutral, también son finales en campo a un solo partido.
Puede tener un pase el asunto, me da mas o menos igual, son pocos partidos para ser relevantes y para mi especialmente irrelevantes al provenir de una población de datos ajena a la población relevante objetiva; el asunto es que el MUNDIAL paró en seco decenas de ligas, con lo que me resulta incompresible rejuntar 750 partidos en 3 meses y APLICAR parte de sus conclusiones, cuando sale algún tema lateral, a la liga española, menudo dislate, que DISPARATE.
(Sobre los del mundial, son irrelevantes, como vos dice, salvo o A MENOS QUE ESOS PARTIDOS SI SE METAN EN LA QUINIELA QUE TOQUE, entonces, mucho me temo que habría que hacer un estudio por separado, por que las variables de la muestra cambian, y de forma relevante, ¿cuantos partidos de campo neutral acaban a 0-0?, pues eso... es un mero ejemplo);
ME DA la impresión que no distingue vos bien ENTRE el concepto de "POBLACIONES" Y de donde coger las MUESTRAS, que por otra parte deben ser al AZAR, pero vayamos al tema:
Seguimos con el otro asunto, ese es el problema, que no LE cuento los partidos del mundial
y aún así se ha apañado usted en "REBUSCAR" por este mundo y si hubiese podido, por otros universos paralelos, 7-4-9 partidos, que se dicen pronto, 749 PARTIDOS en unos 3 meses...
PD:
Estimado PACOHH, las muestras ENORMES pueden ser BUENAS O MALAS, sean de vos o del principe de Zamunda... ¿malas?, obviamente PEOR QUE NADA NO VAN A SER, y mejor que contar solo con 50-100 partidos pues es más que obvio...; pero esa parte de la demagogia barata de foros chusqueros, creo que ya la tenemos superada ambos. ;-), espero.
Como no me tiene usted pillado el ritmo de los sinónimos, metáforas, etc... y por otra parte el significado variado que puede tener una misma palabra:
https://dle.rae.es/malo
YO le aplicaría ESTAS INTERPRETACIONES A SU ENORME MUESTRA de 16.000 partidos:
6. adj. Que ofrece dificultad o resistencia para la acción significada por el infinitivo que sigue. Ej: Juan es malo DE contentar. Este argumento es malo DE entender.
O sea, su muestra es MALA de entender, mala, pero poco. ;-)
malo
1. interj. U. sobre todo para reprobar algo, o para significar que ocurre inoportunamente, infunde sospechas o es contrario a un fin determinado.
En otras palabras, SU DISPARATADA enorme muestra ME INFUNDÍA sospechas en noviembre de 2022, ahora considero que es contrario al fin determinado buscado por una mayoría. O SEA, para mi es MALA, si pretende aplicar algunas conclusiones extraídas de allí, para aplicar al futbol español.
Pero no ERRONEA completamente, he dicho mala, no errónea, si quitamos la arena de la paja, etc..., pues si no, es algo confusa, liante, etc... en fin, para la perfección del numero áureo, su muestra es MALA, pero mala en un sentido suave, digamos de MALA CALIDAD... ;-) para aplicar a nivel local sus conclusiones.
___
MALA en el sentido de "aplanar" los datos o bien en "encontrar" a fuerza de rebuscar por el mundo entero, las excepciones o patrones que ya están caducos en tiempo reciente a nivel local, o no, vete a saber..., MALA en el sentido de DESDIBUJAR la actualidad, y MALA si esas muestras enormes implican desviar esfuerzos y tiempo a un estudio mas detallado de otras variables de FUTBOL más relevantes.
ENTONCES, si eso lleva tiempo, entonces si que son malas maneras de hacer las cosas, bueno, si ya están hechas, y se pueden aplicar distintos filtros, completamente malo del TODO NO ES, pero hay que sabe interpretar y leer entre líneas;
NO puede usted soltar ese SACO de ingredientes en el puchero de la super-mega-pócima y quedarse tan pancho. ;-), por que entre líneas un poco de retranca si que se lee en eso de 159xx partidos y el "empieza a ser fiable"... (eso fue lo que destapó todas las alarmas del buen juicio, ¿como que ¿empieza a ser fiable?...?, ¿hasta cuanto y cuando este sujeto, VOS, ;-) quiere ir sumando partidos? y... ¿de donde los ha sacado por otra parte?, por que uno tiene cierta memoria y lo de los 3.600 partidos de segunda división me patina un poquito para ser un dato práctico, lo que de allí saque en conclusiones quiero decir..., ya le dije que tengo olfato para detectar las bravuconadas mas o menos técnicas ;-), aunque las tapen con miles de números y "cienes" de tablas. ;-)
Y también le dije algún medio cumplido:
... pues mas o menos lo comido por lo servido, ya sabe que me gusta redondear para simplificar SUS POCIMAS DE miles de NUMEROS, si al final el caldo gordo ese que nos prepara cada semana, el aguachirri mencionado, sabe a lo que sabe ;-)..., menudos potajes por otra parte, _) quien se los TRAGUE sin masticar bien y analizarlos, sufrirá indigestión. ;-),
...ahora bien, analizando los mismos se le puede SACAR el saborcillo al asunto, pero ojo, hay que hilar muy FINO y usted no avisa ni nada, (Y SI que lo sabe, pero no le da importancia al asunto), pone el caldo y ale, para dentro todo.
CON muchos menos ingredientes se pueden llegar a conclusiones PARECIDAS, o no, vete a saber, pero no vale poner el carro delante del burro o acertar de pura casualidad...
Se lo voy a explicar de otra forma, por que usted es un hombre ciencias, pero veo que no de matemáticas puras; cualquier estadístico que se aprece de serlo y quien tenga sentido práctico / común, sabe que HAY QUE ADAPTAR LA MUESTRA AL OBJETIVO buscado y que un nivel excesivo de "lo que en principio parece", pulcritud extrema, puede repercutir en las conclusiones de forma evidente; UNA MUESTRA ENORME
NO SIEMPRE ES BUENA, depende el caso y el estudio.
Siempre acabo los post con usted igual, indicando las excepciones que vos no ha visto o previsto y con un NO SIEMPRE, de presente, como regalo quiero decir, el "PRESENTE" TAMBIEN ES un REGALO, le cito de V de Vendetta, ;-):
“El pasado es historia, el futuro un misterio, el hoy es un regalo, por eso se le llama presente.”
Mire..., COMO VEO QUE LO DE el posible error de LAS MUESTRAS "ENORMES" NO LE ENTRA EN EL TARRO, ;-), le voy a poner un ejemplo:
(por cierto, para que no le pase como con "MALAS", el tarro en este caso, se refiere a la segunda definición de la RAE:
https://dle.rae.es/tarro?m=form)
Como un ejemplo lateral, en ajedrez, los Grandes Maestros, GM, suelen tener sus propias bases de datos de partidas, en las que preparan sus libros de aperturas, digamos entre las 15 o 20 primeras jugadas que hacen de memoria, muchas veces, ó a veces incluso más, 25 o 30 jugadas, en función de lo que se ha jugado antes con ÉXITO o si se buscan tablas, menos tiempo consumido en el reloj, etc... según experiencia previa, etc...
Todos los programas informáticos de BASES DE DATOS DE AJEDREZ de los últimos 20 años, pueden realizar un libro de aperturas considerando todas las partidas de las bases de datos y pueden ser decenas de miles, centenares o millones, puntuando la calidad de las primeras jugadas en función de como acabaron esas partidas; eso tiene su peligro, como usted ya sabe y sino lo sabe se lo cuento: el peligro es por que entre la apertura y el resultado de la partida, esta el medio juego y el final, la parte más complicada, por ser los errores más importantes; pero bueno..., como son muchas partidas, la estadística intenta darnos respuestas por volumen de datos, etc, esperando que las MALAS partidas queden enterradas en los CIENES DE CASOS distintos... ;-),
SPOLIER: usted mete los malos partidos del mundo entero, en el mismo saco que los buenos partidos de la liga españiola. ^^ y luego espera que en el Quinigol, buenos equipos obtengan una estimaciones de goles como los malos equipos, MENUDO DISPARATE, impropio de un hombre de ciencias, aunque las mezcle algo con las ciencias místicas. ;-) con razón no le gusta el quinigol, y con razón no acierta el pleno al 15, ;-)
Volviendo al ejemplo del ajedrez, para que COMPRENDA LA DIFERENCIA ENTRE POBLACION OBJETIVO Y MUESTRA DECENTE, y muestra decente no se refiere a que se a GRANDE, sino a que no sea una muestra indecente, ;-); a estas alturas, creo que ha anda el asunto de la "POBLACIÓN relevante" DE PARTIDAS de ajedrez mas o menos registradas, por los 7.000.000 millones de partidas jugadas entre humanos, entre computadoras la cosa se ha ido de madre recientemente, ;-), EDIT: entre 8,5 y 9.75 millones de partidas humanas... que veo que también me quedo obsoleto a poco que dejo de mirar... ;); últimamente hay mucha gente que juega al ajedrez y también por internet. es barato y bonico. ;-), más que el futbol, bueno, vamos al asunto:
The ChessBase Mega Database 2023 is the premiere chess database with over 9.75 million games from 1475 to 2022 in high quality.
Pues aunque a usted le sorprenda, NINGUN GRAN MAESTRO, GM, jugadores de ajedrez por encima de un ranking de digamos 2600, que no hay mas de 500 en el mundo y que vivan de ello menos, o sea, ganando torneos, etc... y ya estoy exagerando; y tampoco ningún jugador de categoría preferente REGIONAL, y de esos hay centenares de miles, se le ocurría crear una base estadísticas de aperturas de las mejores 15 o 20 primeras jugadas, basada en esos 7.000.000 millones de jugadas, por que hay muchas posibilidades que una MALA línea de jugadas, del blanco y negro, jugada muchas veces por ser difícil de interpretar por jugadores mediocres, contra jugadores iguales o peores, tenga buenos resultados; aplicarla hoy en día, basada en datos por volumen, típicos de una muestra enorme, sería como un suicidio en diferido... hay que establecer otros filtros de control.
Luego, posteriormente, también estarían las líneas de jugadas a descartar por que el paso de las décadas ha demostrado que con X jugadas el contrario te puede entablar fácil, aunque haya ocurrido pocas veces, y más bien solo recientemente, etc, pero que si miras en toda la población de partidas, como se ha jugado muchas veces, puede parecer que es una línea aceptable o segura, pero en realidad puedes perder mucho tiempo de reloj, etc, luego en partidas rápidas podría ser mala idea; por otra parte, otro posible filtro, sería por ser una apertura OBSOLETA o compleja, veasé por ejemplo un Gambito de Rey, etc... son ejemplos, no se quede con los arboles, fije-sé en el bosque.
LO PRIMERO que hace cualquier jugador serio de ajedrez es
FILTRAR los DATOS para LA MUESTRA, por que una MUESTRA ENORME puede SER MALA, incluso usar TODA LA POBLACION DE DATOS puede ser una mala idea; por supuesto que si, aunque usted diga que no, en este caso de ajedrez es más extremo que el suyo, un libro de aperturas de ese tipo puede ser malísimo; obviamente peor que NO LLEVAR NINGUN Libro de aperturas y jugar las primeras jugadas al azar no va a ser, al menos mirando el resultado o jugando muchas partidas, jugando pocas, uhmm... ya veríamos, por que la intuición o conocimiento innato del jugador puede compensar en cierto modo, dependiendo de la calidad del mismo;
En el ajedrez, las matemáticas y la música, no siempre requiere muchos años de experiencia previa para que se de bien, hay muchos niños o niñas prodigio en esos campos... a esos no les hace falta tanto libro o estadística para hacerlo bien. Y a algunos analistas de futbol tampoco les hace falta tanto dato para hacerlo bien, incluso pueden hacerlo mejor, por que los datos globales del mundo mundial, podrían confundir o enmascarar los resultados locales. NO solo es azar, el hecho de que regularmente aparezcan acertantes de 14 y 15, con poco presupuesto.
AL TEMA: Las mejores bases de datos de partidas con las que se crean libros de aperturas de hoy en día y que valen dinero..., bueno, cuando se hacía así, ahora con la potencia de calculo de computadoras tipo IA, Alpha y LEELA, engines neuronales, eso tiene un poco menos sentido, pero lo sigue teniendo en parte; el asunto es que LAS MEJORES bases de datos para crear esos libros de aperturas que le digo, no tienen en cuenta mas de unas pocas decenas de miles de partidas... la proporción puede ser tan dispar como un 70 a 1, o incluso mayor, digamos que un 1 %, pasar del 3-5 % ya sería bastante poco adecuado para los 100-300 mejores jugadores del mundo. Y ya no le digo más de ese tema, que también las filtran por tiempo, no solo por calidad de los participantes.
EN su caso, SU ENORME MUESTRA, algo MALA, pero mala en esos significados menos graves, no me sea religioso con la severidad de los términos, me patinaba un poco ya en Noviembre, e hice chanza de la misma en su momento, pero usted no me creía mucho o nada, y ya es la segunda vez que veo que sigue sumando PARTIDOS EN ESA PIRAMIDE DE DATOS CON LOS CIMIENTOS DE BARRO, cuanto más peso le mete a su pirámide, mas hunde los conceptos de su conocimiento de los datos....; pues teniendo en cuenta el parón navideño, mundialero y demás, los 750 partidos me parecen una barbaridad, así, a bote pronto y por pura intuición.
NO PUEDE ESTAR CONSIDERANDO partidos de un nivel similar en tan poco tiempo y en zonas del mundo tan dispares, al igual que no pueden considerarse buenas un gran porcentaje de las partidas de ajedrez jugadas en los últimos 500 años, con acceso a otros recursos y a veces casi con no escritas reglas y éticas distintas.
Cuando habla de muestras, DEBE HABLAR DE FIABILIDAD claro que si, y de margen de error Y CONSISTENCIA DE LOS DATOS, luego ya hablaremos del coeficiente de error, varianza, etc... y no puede reducir el error solo aumentado la muestra hasta tamaños disparatados.
Le cito secciones de google:
Tamaño suficientemente grande: Cuando trabajamos con muestras estamos, normalmente, trabajando con una cantidad de datos inferior a la población. Ahora bien, para que una muestra estadística sea representativa deberá ser lo suficientemente grande como para considerarse representativa. Por ejemplo, si nuestra población está formada por 10 millones de datos y escogemos 10, es difícil que sea representativa. Eso sí, NO SIEMPRE a mayor tamaño la muestra es más representativa.
---
A su lado, poniendo usted cada vez que puede, y nos mete el cazo con su tabla, en el tapiz del foro, su PEDAZO DE MUESTRA, argumentado "que empieza a ser fiable", donde yo digo, que "empieza a ser una doble locura", usted espanta cualquier otro argumentario;
A SU lado, CUALQUIER OTRA MUESTRA podría parecer pequeña, cuando lo que tiene que ser una muestra es en primer lugar es rigurosa, en la fuente, pero TAMBIEN EN LA CALIDAD DE LOS DATOS.
Lo suficientemente GRANDE, no es que pueda usted hinchar la muestra por los siglos de los siglos, por que superado un
offset determinado, por arriba y por abajo, lo pondrá PEOR, incluso PEOR que antes de HINCHAR LA Muestra por un tamaño razonable, errores de interpretación por dispersiones de datos que ya no se dan tan a menudo a nivel local, calidad de los partidos dispares, antigüedad de los mismos con otras normas y e incluso otras reglas, etc... ligas de otros países, con incluso otra forma y en cierto modo otra ética de juego, distintas estaciones del año, no se juega igual en ESCOCIA con el campo hasta las trancas de agua, que en Almería o Murcia, y no saldrán los mismos números de goles, etc..., ni a las ocho de la tarde en otoño que a 35 grados en QUATAR, etc... son ejemplos extremos, no se me quede en los arboles, dejemos la idea del bosque de opciones que ni ha contemplado le puedan alterar sus mega muestras.
EN otros sectores aparte de ajedrez donde eso del tamaño de las muestras se toma con cuidado es en MEDICINA, por motivos obvios. Y NO, no usan las muestras más grandes que pueden por sistema, eso sería una locura médica disparatada.
EN resumen, señor PacoHH, su muestra NO PUEDE NI DEBE CRECER INDEFINIDAMENTE ni en el tiempo, ni en la "anchura "de los datos", anchura, amplitud del campo donde recoge los datos.
Su muestra NO dispone de una fuente tan enorme de datos de una misma calidad, si los aumenta en el tiempo, como mucho me temo pasa en la muestra de +.3500 partidos de segunda división, está metiendo épocas de juego muy dispares, poco sentido práctico por un lado, enorme cantidad de tiempo y "aplanamiento" de los datos recientes.
Si por otra parte, como cuando usted era un buen MOZO, ;-), la muestra de "buenos" partidos le pareció "pequeña", y usted como hombre de ciencias aplicadas, que no puras, ;-), pues quería METER EN VEREDA A LOS DIOSES DEL AZAR, pensaba que necesita miles y miles de partidos; PERO al hacer lectura de un campo más ancho, (metáfora), a decenas de países y categorías, está metiendo en la muestra YA NO datos al azar dentro de una POBLACION, sino datos de menor calidad, distintos niveles de juego y equipos que aumentan "la dispersión" de los resultados, al provenir de distintas poblaciones.
NO se si lo entiende o no lo entiende, pero es una doble LOCURA, una "ciencia" sin seso.
Y eso no quiere decir que su muestra sea MALISIMA, solo es MALA, pero no es peor que NADA, sino que mucho ojo, que se está resbalando por la pendiente de un mal hábito, el ser EXCESIVAMENTE PERFECCIONISTA.
Y NO ES QUE SEA _una MUESTRA así de mala:
---
1. adj. De valor negativo, falto de las cualidades que cabe atribuirle por su naturaleza, función o destino.
2. adj. Nocivo para la salud.
3. adj. Que se opone a la lógica o a la moral.
---
Sino que llama a la confusión de interpretación de los datos a aplicar de forma reciente a nivel local y ofrece resistencia y dificultad para el objetivo buscado. Cuesta esfuerzo innecesario y podría confundir en el quinigol, sin extraer solo lo bueno de ese pedazo de disparate de mega tabla de 16.000 partidos.
*** La población máxima de partidos, estimado PACOHH,
es la que es, TANTO EN EL TIEMPO COMO EN EL NÚMERO, y usted no puede o mejor dicho, NO DEBE INFLAR la población de análisis de los partidos de la quiniela, para por ejemplo, establecer un criterio del pleno al 15, en función de los goles medios, etc..., metiendo POBLACIONES "similares" pero no idénticas de otros países; por ejemplo, los datos que aquí tiene, en España, le parecen POCOS, pero, ¿pocos para qué?, ¿en función de que margen de error?, ¿por que con un 95-99 % ya es más que suficiente, mucho más que eso es el azar dentro de sus selecciones personales, varianza real de resultados, y errores de aciertos de los porcentajes reales, etc..., en algunos países será similar, pero eso es jugarsela, está apostando a que las poblaciones de donde recoge datos sean similares, pro que según vos, todo es fulbol, pero no será igual, en todos ni mucho menos, ni por supuesto tanto tiempo, al menos no sin estudiar esas poblaciones por separado ANTES DE FUSIONARLAS, con un "estudio previo de campo", y no me refiero a que vaya a ver los campos de futbol de Turquia o Escocia. ;-)
Eso, POR UNA PARTE, no es recoger datos la azar para una muestra estadística, primer principio de una BUENA muestra, pues está seleccionando los datos con un criterio..., y por OTRA PARTE no está evaluando toda A TODA la población de datos, que falsamente y erronea-mente, algunos HOMBRES malos DE CIENCIA, que no matemáticos, piensan que el IDEAL del dorado de las estadísticas es recoger todos los datos posibles, sean de donde sean.
Pues mire por donde, va a a ser que NO, que eso es MAL proceder, y se lo cuento el criterio del sentido común, sin echar ni un puñetero numero, sin antes de ello, saber y PLANIFICAR por que y para que echamos cuentas..., usted "está" mezclando poblaciones de datos de partidos, recogiendo muestras distintas pero de DISTINTAS poblaciones; NO está HACIENDO SU MUESTRA de futbol para la quiniela española o para argumentos laterales de conocimiento LOCAL del futbol español MAS GRANDE, la está haciendo más imprecisa y plana en sus diferencias y NO ME DIGA QUE TODOS son partidos de futbol, por que eso es como intentar medir la ALTURA MEDIA en centímetros DE LOS ESPAÑOLES/ESPAÑOLAS y recoger los datos de altura de medio mundo y argumentar que TODOS SON HUMANOS.
O bien medir la temperatura media de la tierra tomando los datos de los últimos 100.000 años, y luego hacerse la media, como son los 3600 partidos de segunda división..., ¿una muestra más grande?, ¿qué por ejemplo la de los últimos 100 años?. qué su muestra es mejor, ¿para que?
Para: ¿saber o estimar la próxima glaciación ?. Algo que para el objetivo buscado, saber si tengo que aislar una casa para 5 o 10 grados de diferencia, ¿quedará alguna casa en pie para entonces?... VE usted el disparate estimado PacoHH...
Obviamente son casos extremos, pero al final siempre USTED, o sea, VOS y YO, siempre acabamos igual.
USTED DICE: (parafraseando)
Las muestras mejor GRANDES que pequeñas, anden o no anden, ;-) debe de recordar el refrán, como los caballos, ;-)
y yo le digo lo de siempre, que ya es casi un hábito:, NO-SIEMPRE.
Le cito el PDF que encontré en una busqueda de 60 segundos para apuntalar el post, por si necesita otras opiniones de una evidencia matemática... en
google:
El primer aviso es que no existe un tamaño bueno para todo.
Según el tipo de muestreo que se vaya a realizar, los objetivos que se persigan,
las características de la población y las condiciones en las que se van a realizar las estimaciones,
serán aconsejables unos tamaños u otros.
Podría parecer que una muestra es mejor cuanto más grande.
Pues sí, podría parecerlo, pero no tiene por qué ser cierto.
Cuanto más grande, las estimaciones serán más precisas y con menos riesgo de error.
Pero también saldrán más caras y tal vez se reduzca el control en la recogida de datos, por lo que,
repito, no existe un tamaño bueno para todo.
Ocurre además que si el muestreo ha sido malo,
la muestra grande será grande pero igualmente mala
Mire por donde, otra persona, que LLAMA MALAS A LAS MUESTAS enormes sin precisión o conocimientos exactos.
Este parrado anterior va al hilo este del foro, por quejarse VOS, sin razón, de lo BUENA que es su muestra y lo MALO que es mi comentario. ;-), atrevido me dice vos, TEMERARIO VOS, con los datos, le digo yo. ;-)
Mi queja va en el sentido de que USTED NO TIENE DATOS suficientes de partidos de quiniela española para hacer muestras de decenas de miles de resultados y ha fallado "un grado" "X", en la RECOGIDA DE DATOS, a evaluar cuanto offset hay que meterle a su tabla para mejorarla; no va a comprender mejor el futbol español, re-sumando todo el futbol mundial. ESE ES SU ERROR conceptual.
Y seguimos para bingo y le cito el PDF de ese google link, así en unos 60 segundos de búsqueda..., aunque hay muchos links que referencian al disparate de la extrema pulcritud, al excesivo perfeccionismo de las ENORMES MUESTRAS MALAS. (malas de interpretar correctamente, no malas per se, quien sabe lo que tiene entre manos, puede aplicar criterios correctores y quedarse con lo mejor de cada casa... ;-)...)
cito del PDF:
Parece lógico suponer que conforme aumenta el tamaño de la población, también
debe hacerlo el de la muestra. En cierta medida es así. Pero la relación entre ambos no
es proporcional: la muestra aumenta más despacio hasta que llega un momento en que
por muy grande que se haga la población, el tamaño de la muestra no se inmuta.
TOUCHE, y por otra parte, confirma lo dicho lo siguiente:
Conforme aumenta el número de elementos de la población (personas, hogares,
fábricas o lo que sea que estemos investigando), es lógico que deba ser mayor la
muestra, pero cada nuevo elemento en la población añade menos a n.
Esto también es lógico.
De 1 a 2 hemos duplicado el número, pero de 107 a 108 no hay mucha diferencia,
mientras que 9999999995 y 9999999996 son la misma cosa.
Ojo con el peligro de ese párrafo, eso no quiere decir que sus datos no puedan EMPEORAR, y es la parte que no comprende o no quiere comprender y es que en el peor de los casos NO Es que se quede con la mejor conclusión posible y sea la misma cosa, en SU CASO SI que pueden empeorar por que está metiendo y añadiendo cada vez más partidos de peor calidad y de otros sitios con menor relevancia práctica, cuando más grande es su pirámide de locura de datos, más diluye los buenos ingredientes de su pócima, bien sean los datos locales, y/o estimaciones de porcentajes y distintos criterios que en principio tienen más peso, y por supuesto baja su calidad de datos para acertar el pleno al 15, tanto en el tiempo reciente como en el tipo de resultados posibles más habituales.
Ya no es una muestra al AZAR, dentro de una población determinada, al querer ampliar a toda la población posible, se ha salido del tiesto y se ha ido a por UVAS a las ligas los hombres extraordinarios de vete a saber donde ni cuando, ;-). (edit: asi por lo pronto a la liga TURCA y ESCOCESA)
MUCHO OJO, por que aumentando la muestra de esa forma suya. LA SUYA, SU DISPARATADA MUESTRA desde poblaciones diferentes, similares pero diferentes, le esta metiendo mucha ARENA AL CALDO, que no CAL para el cemento de su pirámide; para hacer a su "caldo gordo", que a usted le parezca gordo intelectualmente hablando..., pero para algunos su sopa de números, su pócima de los druidas de las ciencias místicas, estimado PacoHH, empieza a rascar en la gartanta de tanta arena que nos hace tragar con cada tabla, ;-), algo no cuadraba en eso de "MI "muestra", o sea, la suya, la de BetFair Exchange NO, LA SUYA, la muestra con +15.000 empieza a ser fiable"... cuando ya va por unos alucinantemente imprecisos especialmente a nivel local, 16.000 partidos del casi el mundo entero... ^^.
No vamos a hablar de varianzas, errores de precisión, coeficientes de fiabilidad, nivel de confianza, etc... para todo eso ya hay formulas, pero es que USTED, a falta de muchos DATOS locales y compresión del futbol, y no poder inventarse-los, lo que hace es sumar datos de otras poblaciones "similares", añado, que USTED, como el gestor considera y así valora, luego ya le está metiendo su tinta a la "encuesta" de marras, al libro gordo de Petete... ;-) es una decisión arbitraría y selectiva la suya, lo hace, por que si, y por que así lo quiere... luego las conclusiones son las suyas por que así las ha buscado.
Venda la moto esa como quiera venderla, gratis si quiere, ok, pero no con la etiqueta del "conocimiento absoluto", por encima del conocimiento LOCAL humano de la liga española, o aplicable al resultado a goles del pleno al 15, o bien por encima de las casas de intercambio en lo que sea menester, etc..., a mi las casas de apuestas no me interesan para apostar a partido si, partido no, no se hace nadie rico haciendo eso... o al menos casi nadie, y mucho menos durante mucho tiempo..., se puede hacer así o no, lo de sumar datos sin ton ni son, pero no DIGA QUE SIEMPRE ES MEJOR su sistema, por que NO SIEMPRE ES ASI.
cito otro parrafo curioso de ese texto en PDF que le dije antes:
En estos casos acudimos a Fisher, al que hemos conocido en el monográfico sobre estimación estadística.
Desde que sugirió un riesgo del 5%, nadie ha abierto la boca para decir otra cosa.
Se considera que un riesgo de 0,05 es válido por defecto.
Si alguien osa tomar otra decisión se le preguntará por qué.
Como no queremos dar explicaciones, todo el mundo escoge irreflexivamente 0,05.
Se admiten dos excepciones: 0,01 para mostrar que uno es muy exigente y */**, es decir,
el número de asteriscos que suministra SPSS, un programa de ordenador que se está utilizando como
referente desde hace tiempo. Sabemos que muchas personas deciden dejar de pensar
cuando se les presenta la oportunidad para ello. SPSS, un programa tonto de ordenador
(como todos los programas de ordenador, por definición), suministra esa oportunidad.
Si afirmas “me lo dijo SPSS”, suelen dejarte en paz.
Ese párrafo lo he metido por que me ha hecho gracia, por que VAYA que es verdad que eso pasa...
En otras palabras, si afirmas que tu muestra tiene 15.999 partidos en cinco años, suelen dejarte en PAZ, ¿verdad estimado PacoHH?, bueno, CASI SIEMPRE, ;-),o sea, NO-SIEMPRE, por que puede que a lo largo de las décadas aparezca algún "ateo" de las narices... ;-) que dice que esas pedazo de muestras demuestran desconocimiento del comportamiento de los datos estadísticos.
__
En resumen, estimado PacoHH, sin menospreciar "en mayor exceso" sus conocimientos en otros campos, y no me refiero a los de césped, que en esos tampoco, y lo reconoce vos a menudo..., tamaña muestra de conocimientos la suya, ;-), digamos excepto la super mega muestra de las decenas de miles de partidos para echar en la pócima de los miles de números, todo este debate no tiene solución para VOS.
USTED NO PUEDE O NO DEBE "recoger" casi toda la población de datos de partidos que encuentre, eso no es práctico, ni juicioso y por otra parte,
y no solo me refiero al dislate de recursos y energías que eso implica, al fin y al cabo de lo suyo gasta, y salvo un servidor, nadie ha osado jamás en las décadas del foro en decirle, que para ESE VIAJE no le hacen falta tantas alforjas... y a ver si vamos a esta saliendo desnudos al centro de la plaza a publicar el "bando" semanal, solo con una tabla de números tapando nuestro desconocimiento del futbol español de la quiniela... ;-).
Tal vez, es una estimación con margen de error este comentario, deba de bajarse de ese "pulpito" del extremo perfeccionismo y empezar a considerar un margen de error ACEPTABLE; deje eso de las muestras infinitas para los debates filosóficos, usted no tiene NI TANTOS DATOS, ni aunque los tuviese sería útil, ya no por irrelevante, sino directamente por confuso y posiblemente erroneo, añadirlos. LOS DATOS DE LAS MUESTRAS, también caducan, como todos. Al final todos caducamos, unos antes que otros. ;-)
De poco sirve como jugaban en segundo división hace 30 años y de poco sirve como jueguen al futbol en la liga Irlandesa o escocesa, en la que habrá dos o tres equipos mas o menos decentes y ya... ;-) para luego, por ejemplo, aplicar criterios de quinigol en la liga española.
(meta los partidos menores categorías españolas y le saldría más a cuenta, mal también, pero no se... digamos, que menos mal me parece... pero mal tambien, ¿o es que nunca a visto quejarse a los equipos grandes cuando tienen que jugar en un campo de baja categoría lleno de baches?, por poner un ejemplo)
USTED NO TIENE esos datos aplicables para la quiniela española, por que no es posible tenerlos, no ha habido tiempo material ni volumen de equipos para generarlos, NI PUEDE acumular datos argumentado que consigue mayor fiabilidad en conocimiento del futbol español, ya le he explicado por que eso NO SIEMPRE ES CIERTO, sobre todo por que está empeorando la calidad de los datos.
Pero no se agobie por tener que REDONDEAR y hacer estimaciones con offset, hombre de ciencias, pero algo mezcladas con las místicas, para eso la estadística tienen herramientas; que ¡si corcho!, que ¡si!, que no pasa nada por meterle a los datos un margen de error, ponga a su potaje de la pócima de los miles de números un anexo, con margen de error 0.95, o 0.99, si queremos parecer muy pulcros.
Mire, si hubiese indicado algo así desde el principio, en esa tabla de locura rozando el TOC TOC, ni esta conversación ni la otra hubiesen tenido lugar. ;-)
Eso si, no se extrañe que cuando me vienen los textos de los DRUIDAS de los números a mis ojos, en forma de tablas de MOISES, al parecer con una PATINA DE severidad de mandamiento, por que tiene muchos partidos en la chepa de la tabla, ;-), que no se pueden o deben poner en duda por que es un "ATREVIMIENTO", que argumentan al parecer con MARGEN DE ERROR CERO patatero, ya veo por qué y por donde sale el CERO, ;-)...., o que SU muestra es la mas grande del foro, aja¡, ya veo de donde salen los datos, y como nadie dice nada, empiezan a creerse algunos a SER MAS FIABLES que nadie en el universo mundial, y que algunos creen supervisar a BetFair Exchange del mejor modo posible, va veríamos si ese tema fuese de interés a analizar, que por mi parte va a ser que no, pues mire por donde, ESO de las tablas de 16.000 partidos y empiezan a ser fiables, SONó y SUENA A DESAFÍO.
Un desafío con números, ;-) y con pocas letras, por que no gustan las letras, por que como dijo vos una vez, con las letras se puede uno confundir al interpretar,... efectivamente ...¡. ¿y con sus números no?, estimado PacoHH. ¿no se está confundiendo con esa sopa numérica con un cierto "saborcillo a campo" verde, pero de verde con moho? por datos tal vez obsoletos o inapropiados mundiales datos generales... ;-)
No es un error grueso, es un error sutil el suyo, aparte del ingente trabajo personal, ese "defectillo" en los datos puede pasar desapercibido; bueno, yo lo arreglo, sus tablas digo, quitando TODOS LOS DECIMALES, después de ese, es de suponer "para usted curioso" ajuste, pues se quejaba no hace tanto que las casas de apuestas o onlae, solo tenían dos decimales, valgame dios, dos decimales, de supuesta pulcritud extrema..., su tabla me resulta más útil en términos generales, considerando siempre un offset de error, es más fácil de usar y no llega a uno a autodestruirse contando comas y decimales, el resto del tiempo le hecho en mirar otras variables, es el equilibro lo que vale o más pesa, no la concentración de recursos en una sola cosa, sobre todo si esa cosa esta "errada" o tiende a la dispersión de datos... y de forma innecesaria por otra parte, por que si sabe o valora en su justa medida lo que es un 0.95 o 0.99. vería que NADA DE ESO le hace falta.
Usted intenta "cuadrar" su ciencia quinielistica, o sea, en conocer más a fondo el futbol, "con más datos" de los RAZONABLES, con los que sea, por que a falta de tiempo dedicado a observar el futbol LOCAL, la cosa es añadir datos, usted HA DEJADO DE PENSAR EL FUTBOL de primera división y segunda, si alguna vez lo hizo, por que se ha sustituido a si mismo por un ordenador y como piensa que mal es tener pocas variables, va y le mete muchas al asunto...: y no le ha pasado solo a vos, es un mal general de todo el DPN.
(como insinua el autor de ese pdf que le linkee antes)
...un programa de ordenador que se está utilizando como
referente desde hace tiempo. Sabemos que muchas personas deciden dejar de pensar
cuando se les presenta la oportunidad para ello. SPSS, un programa tonto de ordenador
(como todos los programas de ordenador, por definición), suministra esa oportunidad.
Al usar tanto datos, pasará que con el tiempo muchos datos son, en Yoda-mode me pongo ya: serán los datos obsoletos en la dinámica actual del futbol;
La población de datos no puede ensancharse a lo ancho por que te falten datos para reducir el margen de error; VIVA usted CON ESE MARGEN DE ERROR, no está FALLANDO la quiniela y el pleno al 15, por el 0.95 o 0.99; la esta fallando por que tiene componente de AZAR y peso enorme de combinaciones... y por que tal vez está centrando el tiro siempre en las mismas zonas, 80.000 arriba o 80.000 abajo; no es para tanto el offset que propone la ciencia, para que vos quiera reducirlo usando imaginarios y erroneos supuestos del 100 % de población finita..., para nada valido ese asunto de los 16.000 partidos de marras y los 3600 de segunda división..., la muestra se coge de la misma IDENTICA población y de no poblaciones similares y mucho menos desplazadas en el tiempo..., la variable de reunión de datos no es que todos sean partidos de futbol;
En resumen, hay que hacer las cuentas justas, aunque las haga una computadora y empezar a pensar en futbol, bueno, mejor dicho al revés, por que si primero pensamos en el futbol, las cuentas serán más sencillas, al eliminar por intuición humana muchos resultados innecesarios que no debe tener en cuenta un ordenador, a riesgo de inflarse las filas y presupuestos. Y poniendo 14 triples al asunto, MAL EMPEZAMOS pensando en de todo, menos en futbol. ;-)
El resto del tiempo que ya no se usa para acumular cienes de tablas de números de dispares ligas mundiales, pues en ver como juegan cada equipo actualmente o en los últimos años de lo que realmente el influya y NO es juicioso considerar LA LIGA ESCOCESA Y LA TURCA, que me las traen al pairo... (concepto marítimo aplicable a esta pesca de premios) en toda esta historia de las quinielas y quinigol, etc...
¿es tiempo perdido el suyo?, no del todo, se pueden sacar conclusiones, quitando y poniendo variables si en esa fuente de datos tiene los índices adecuados para poder retirar toda la morralla que le digo, morralla a descartar por el creador del análisis, o sea, por un ser humano, por que el ordenador, tonto es y tonto será, pero espere unos años, y alguna IA, no las de ahora, le enseñará a hacer BIEN las quinielas, y ya verá como esa IA, no cuenta los GOLES de los equipos de la LIGA de Luxemburgo, para calcular o estimar los porcentajes de equilibrio a repartir entre las opciones del pleno al 15 de la liga ESPAÑOLA: ;-) ^^.
Puede mejorar su "presente", y tome esto como un "regalo", recortando sus tablas aquí y allá, de esta forma puede establecer "a partir de que margen de partidos" empieza a ser irrelevante el asunto ir hacia atrás en el tiempo.
Quitando y poniendo se puede ver como varía el asunto, aunque la ciencia eso ya lo tiene muy medido y considerando cierta varianza y margen de error quedan conclusiones mas o menos muy decentes. SUFICIENTEMENTE DECENTES, más que nada, por que no hay más datos de donde sacar el asunto, más lejos de unos pocos años y unas cuantas ligas para aplicar al nivel de cada equipo en juego.
Ojo, por que eso es importante, podría establecer una media de ciclos y calidad de los equipos, por variables que puede que no tenga acceso, pero si a como juegan los equipos y sus ciclos de mejor o peor juego, al paso del tiempo, etc... al igual que se establecen criterios para establecer medias entre ciclos de subida y bajada macro-económicos, entre 5 a 7 años, hasta 12-15 años, etc...; Bueno, en esta parte nos vamos a otro tema, más que nada de antropología futbolera, importante para unas buenas bases y criterios del futbol... pero debe ser interpretada por un humano, no sumada por una calculadora sin son ni son, demonios ¡, que todo hay que explicarlo. ;-)
El asunto está bastante claro, sus muestras no son MALAS como una muestra MUY pequeña, pero podrían ser peores que una buena muestra MEDIA, son sus tablas, un poco malas de otra forma distinta, imprecisas si cabe; pues SI, corcho que si¡ ;-), añade VOS más datos y se vuelven más y más imprecisas, mire por donde, en el 0-0, va la cosa despuntando maneras, con decimales, pero mal empezamos, ;-); Y para terminar, hay que saber usar los datos de una muestra pequeña, que tendrá su margen de error, etc... pero hay que ser más práctico, no siempre gana la grande a la pequeña, todo bien jugador de cartas lo sabe... todo apostador nato lo debe conocer, nada es siempre lo que parece.
NO se por otra parte, ni he puesto interés, en si las casas de apuestas de intercambio hacen las cosas como VOS, sumando y re-sumando hasta quedarse obsoleto perdido...., no tengo estudiado el asunto, pues no me interesan ese tipo de apuestas de las casas a pocos partidos, pero dice que VOS les supervisa de esa manera; bueno, A SU MANERA; si es así, que dios coja confesaos a todos los apostates basados SOLO en esos criterios,
fina es la línea que separa la cordura y la ciencia sin seso, la doble locura. ;-)
PD: eres muy osado al decir que mis enormes muestras son malas.
---
Pues le respondo a ese hecho con una cita, que es algo antigua en el tiempo, pero no por ello OBSOLETA, las letras caducan más tarde que los números:
“Me atrevo a hacer todo lo que sea digno de un hombre, quien a más se atreve, no lo es”.
;-)
Saludos Estimado PacoHH,
QuimeraORO