Cómo calcular P-hat

En estadística, la letra “p” denota la probabilidad de que ocurra cierto evento o de que cierto parámetro sea verdadero para una determinada población, pero cuando una población es grande, puede ser poco práctico o imposible medirla directamente. Como alternativa, los estadísticos toman una muestra que pueden medir y denotan el resultado como “p-hat”, que se escribe como p con un sombrero triangular sobre él (^). Esta estrategia de muestreo es común en las encuestas políticas que buscan determinar cuántas personas en el país están de acuerdo con una determinada política o aprueban el trabajo que está haciendo un funcionario del gobierno, como el presidente.

Calculando P-hat

El cálculo real de p-hat no es un desafío. Para hacerlo, necesita dos números. Uno es el tamaño de la muestra (n) y el otro es el número de ocurrencias del evento o parámetro en cuestión (X). La ecuación para p-hat es p-hat = X / n. En palabras: encuentra p-hat dividiendo el número de ocurrencias del evento deseado por el tamaño de la muestra.

Un ejemplo ayuda a aclarar esto:

Una encuesta desea determinar cómo los estadounidenses están de acuerdo con las políticas del presidente actual. Los encuestadores se ponen en contacto con 1.000 votantes y hacen la pregunta: “¿Aprueba usted las políticas del presidente?” La encuesta produce 175 respuestas afirmativas y 825 respuestas negativas, por lo que p-hat para la encuesta es 175 / 1.000 = 0,175. Los resultados generalmente se reportan como un porcentaje, que en este caso sería 0.175 x 100 = 17.5 por ciento.

La importancia de P-hat en las encuestas

Si bien es posible determinar p-hat, el valor de p sigue siendo desconocido, y el grado en el que es posible confiar en p-hat como una representación precisa de p se conoce como nivel de confianza. P-hat es una representación confiable de p solo si la muestra es lo suficientemente grande y es verdaderamente aleatoria. Si bien los encuestadores políticos se esfuerzan por garantizar muestras aleatorias, a menudo es difícil hacerlo en la práctica y los resultados suelen estar sesgados. El sesgo se puede contrarrestar tomando muestras más grandes o repitiendo la encuesta en diferentes partes del país.

Otro factor que influye en el nivel de confianza de p-hat es el número de encuestados en una encuesta que realmente responden a la pregunta. Muchos se negarán a responder y optarán por permanecer indecisos, y cuanto más lo hagan, menos podrán los encuestadores relacionar significativamente p-hat con p. Una forma de contrarrestar esto es hacer preguntas sencillas que requieran respuestas de sí o no.