¿Cómo calcular el valor P en Excel? Guía paso a paso

El valor P es un término estadístico que te ayuda a determinar, si la hipótesis que utilizas es cierta, la probabilidad de la variación muestral. Simplemente nos dice cuáles son las probabilidades de obtener esos resultados si nuestra hipótesis nula es cierta.

  • A hipótesis nula es una hipótesis que afirma que los resultados que obtenemos se deben a la pura suerte.
  • Un hipótesis alternativa afirma que los resultados que obtenemos no son fruto de la suerte, sino que hay elementos externos que afectan a nuestros resultados.

Es un término estadístico muy importante y de uso común y puede calcularse fácilmente en programas de análisis de datos como Microsoft Excel. En este artículo, aprenderás cómo lo utilizamos, dónde lo utilizamos y cómo podemos calcularlo en Excel de varias maneras.

¡Comencemos!

Al hacer una investigación con grandes poblaciones, tienes que calcular las estadísticas de cada individuo. Pero incluso en ese caso, no puedes estar seguro de si algo ocurre por coincidencia o simplemente por suerte, ya que es imposible observarlo todo. Esto es donde entra la estadística.

Los cálculos estadísticos no pueden darte una verdad absoluta pero te ayudarán a tener una buena idea de tus investigaciones.

El valor P nos permite probar la hipótesis sobre nuestro tema. Podemos comparar los resultados matemáticos con estas hipótesis y reconsiderar nuestro camino sin dedicar mucho tiempo a la investigación.

Utilizamos el valor de la probabilidad cuando intentamos probar una hipótesis. Puede tratarse de una investigación o de una simple apuesta que hemos hecho con nuestro amigo.

Es más fácil entenderlo con ejemplos.

El marketing:

Supongamos que trabajas en el área de marketing y tu proyecto reciente es sobre la publicidad de los cereales.

Has producido un vídeo para las redes sociales y has conseguido la información para los usuarios más bien lo han omitido o lo miró durante mucho tiempo.

Como ejemplo, el tiempo de observación común del vídeo es de 20 segundos. El media es de 20 segundos. Y has tomado la decisión de editar el vídeo con un trozo de música más alegre.

Ahora, ¿cómo reconocerás si ha funcionado? En este momento, utilizamos estadísticas de significación.

Primero, elabora una hipótesis nula:

Una hipótesis nula afirma que hay no hay correlación entre lo que inviertes y los resultados que obtienes. No afecta a los resultados.

En este ejemplo, la hipótesis nula será la siguiente "No hay ninguna relación entre los cambios que estás aplicando al tiempo del reloj."

Entonces, la hipótesis alternativa:

La hipótesis alternativa sugiere que realmente cambiar la música funcionó y ahora la gente ve el anuncio durante más de 20 segundos. Matemáticamente, la hipótesis alternativa dice

"La media es ahora mayor de 20 segundos".

Calcula el nivel de significación:

Ahora tenemos que establecer un umbral límite para calcular si tenemos éxito o no. A esto se le llama nivel de significación se le denomina adicionalmente valor alfa. Puede ser cualquier porcentaje que quieras, depende absolutamente de ti.

Pero en este ejemplo, será 0,05.

Ahora bien, para calcular con certeza deberíamos tener siempre todos los datos del tiempo del reloj. Pero en lo que respecta a tu tiempo y fuentesdebes tomar una muestra de la población:

  1. Has tomado una muestra de 100 personas.
  2. Estas 100 personas tienen 25 segundos de tiempo de observación del anuncio.
  3. Significa que la media de la muestra es 25.

Esta es una versión muy sencilla del cálculo. Pero la desviación típica de la muestra suele calcularse en esta escala si no conoces la desviación típica de toda la población.

Puedes utilizar los valores que has calculado para la muestra, ya que se acercan a los valores de la población. La media de la muestra se aproxima a la media de la población.

Calcula el valor P:

El valor p nos indica si podemos rechazar la hipótesis nula o no. La probabilidad de que la media de la muestra sea mayor o igual a 25 minutos dada la hipótesis nula es verdadera.

Pueden darse dos situaciones.

  1. Si el valor p es menor que el alfa puedes rechazar la hipótesis nula. Tienes una prueba estadística de que la hipótesis alternativa es verdadera.
  2. Pero si el valor p es mayor o igual que el alfano puedes rechazar la hipótesis nula. Esto no significa que la hipótesis nula sea ciertamente cierta, pero tampoco puede evitarse.

Probabilidad

Vamos a trabajar con otro ejemplo.

Tu amigo y tú habéis lanzado una moneda al aire: Si es colas pierdes 5 dólares y si sale cabezas ganas 5 dólares.

  • Tu amigo lanza la moneda una vez: Sale cruz. Está bien, hay un 50% de posibilidades de que salga cruz. Ahora, supones que la probabilidad es 0,5 porque crees que es una moneda justa. Esta es tu hipótesis nula.

Pero hay otra posibilidad, la moneda es complicado. Mientras calculas el valor p, actúas como el la hipótesis nula es verdadera.

  • Segundo: Es cola. Has perdido otros 5 dólares, pero no pasa nada porque sigue habiendo una buena probabilidad de dos colas seguidas. El valor p es 0,25 y sigue siendo una proporción justa.
  • Tercero: vuelve a salir cruz. La probabilidad de que haya cola tres veces seguidas es de 0,12. No es baja, así que no hay pruebas suficientes de que la hipótesis nula no sea correcta. Pero empiezas a pensar que tu hipótesis alternativa podría ser correcta.
  • Cuarto: Si vuelve a salir cruz, verás que las probabilidades son muy bajas. Puede ser una coincidencia milagrosa, pero sigue habiendo una probabilidad de 0,6 y todavía no hay pruebas suficientes para apoyar la hipótesis alternativa que dice que la moneda está trucada. Y esperas al quinto lanzamiento.
  • El quinto: Es cruz. La probabilidad de que una moneda salga cruz cinco veces seguidas es de 0,3, lo cual es muy bajo. Este es el punto en el que puedes rechazar la hipótesis nula, ya que no hay pruebas suficientes para apoyarla.

Le pides a tu amigo que vea la moneda y cuando la tienes en tus manos te das cuenta de que tiene dos caras de cola y que es una moneda trucada.

¿Qué nos hizo perder la fe en nuestra hipótesis nula?

En un juego justo de lanzar monedas, la probabilidad de obtener cara o cruz es del 50%. Se trata de una situación en la que creemos que la moneda es justa, pero al bajar el valor p nuestra confianza en esa hipótesis también se debilitó.

Hay pocas probabilidades de tener cruz al azar cuando el valor p cae por debajo de 0,05. Por eso, cuando se aplica este término estadístico en asuntos como las investigaciones sobre el cáncer o los efectos del cambio climático, cobra más importancia.

Nota: No hay ninguna razón específica por la que utilicemos un valor p de 0,05 para el cálculo por defecto. El creador de la fórmula decidió que era un buen número para calcular y los cálculos por defecto se ciñen a él.
0,05 significa un 5% en 100 individuos de la población que cae en la curva normal. Esta es una de las razones por las que se utiliza habitualmente. Si quieres cambiarlo al calcularlo tú mismo, puedes hacerlo.

Hay más de una forma de calcular el valor p en Microsoft Excel. Puedes escribir las fórmulas o puedes utilizar Herramienta de análisis. Este artículo contiene cómo hacerlo de ambas maneras.

Uso de las fórmulas clásicas de Excel:

Empecemos por la forma clásica de las fórmulas de Excel. Hay dos formas de hacerlo Fórmula TDIST y Fórmula de la prueba T.

1.1) Fórmula TDIST

En primer lugar, necesitarás un conjunto de datos para calcular un valor p.

  • Supongamos que eres un profesor y quieres comparar la puntuación de tus alumnos en tu último examen y qué puntuación esperabas que obtuvieran en función de sus exámenes anteriores.
  • Tienes los resultados 25, 46, 34, 27, 35, 43, 40, 44, 21 y 39 de tu último examen.
  • Ahora para el cálculo, necesitas otra cola, esta es la puntuación que esperabas según los exámenes anteriores: 23, 44, 32, 20, 46, 37, 35, 42, 33 y 35

Ahora, para utilizar la fórmula del valor p en Excel, debes calcular previamente algunas cosas:

Coeficiente de Pearson (r): Es un término estadístico que mide la correlación lineal entre dos datos. No es necesario que conozcas su aspecto matemático para calcular el valor p. Verás la fórmula sencilla para ello en los próximos párrafos.

Población (n): n es el número total de individuos de tu conjunto de datos.

Estadística T: Es la relación entre la desviación del valor estimado de los datos respecto a su valor supuesto y su error estándar.

Grado de libertad: Es el número de individuos del conjunto de datos menos dos.

cómo calcular el coeficiente de pearson en excel - Valor P

Ahora, el Coeficiente de Pearson se escribirá en F4 en este ejemplo. Después de hacer clic en él, escribirás la fórmula:

=PEARSON (C4: C13; D4: D13)

Las columnas C son para las puntuaciones y las columnas D son para las puntuaciones esperadas. El coeficiente de Pearson es 0,691473 en este ejemplo.

cómo calcular el coeficiente de pearson en excel-2

A continuación, escribirás el número de individuos del conjunto de datos. Si sabes con certeza cuántos individuos tienes puedes escribirlo manualmente, pero si no lo sabes puedes utilizar la fórmula:

=CONTAR (C4, C13)

¿Por qué la fórmula sólo contiene una columna C?

Se debe a que sólo necesitamos los individuos de un conjunto de datos para calcular, por lo que una sola columna será suficiente. La celda G5 contendrá ahora el número 10. Esta es nuestra población.

cómo calcular el valor-p de la función de recuento

Ahora que tienes los dos Coeficiente de Pearson y la población puedes calcular Estadísticas T. La fórmula matemática de la estadística T es el coeficiente de Pearson (r) por la raíz cuadrada del signo de la población (n) menos 2, dividido por la raíz cuadrada de 1 menos el coeficiente de Pearson al cuadrado:

=(G4*(SQRT(G5-2)))/SQRT(1-G4^2)

La celda G6 contendrá el resultado 2,70733. Esta es nuestra estadística T.

cómo calcular la estadística T en excel

Después, calcularás el grado de libertad. Escribirás:

=G5-2

A la célula G7. Este es el grado de libertad. Estará en el 8.

Ahora tienes todo lo que necesitas para calcular el valor P. La celda G8 contendrá la fórmula para ello. Es decir:

=TDIST (estadística t, grado de libertad, colas)

O

=TDIST (G6, G7, 2)

El resultado será 0,026768. Éste es el valor p del conjunto de datos.

cómo calcular el valor p en excel

1.2. Fórmula de la prueba T

La segunda forma de determinar el valor p con fórmulas de Excel es utilizando la fórmula de la prueba T. Es un poco similar al ejemplo anterior, pero más breve.

  • Digamos que el conjunto de datos es el mismo, tienes los resultados 25, 46, 34, 27, 35,43, 40, 44, 21, 39 para tu último examen.
  • Los resultados esperados son 23, 44, 32, 20, 46, 37, 35, 42, 33, 35.
  • Vas a añadir una tercera columna para la diferencia entre lo esperado y la puntuación real. En la columna de la diferencia se escribirá 2, 2, 2, 7, 11, 6, 5, 2, 12, 4 de E4 a E13.

Ahora escribe la prueba T en la celda E8. Vas a escribir la fórmula de la prueba T en la celda en blanco de al lado. Es decir:

= Prueba T (C4:C13, E4:E13, 1, 1)

Y esta fórmula te dará directamente el valor p.

Determina el valor P con el paquete de herramientas de Excel

Took Pak es un paquete que te permite calcular varias medidas estadísticas de forma automática, por lo que es fácil y muy práctico. También es fácil de instalar.

Paso 1: Ve a la configuración. Hay un botón "Complementos" en la parte inferior de la esquina izquierda, haz clic en él. Aparecerá una nueva ventana, busca la opción "Paquete de herramientas de análisis", haz clic en ella y, a continuación, haz clic en el botón "Ir" de la parte inferior de la ventana.

Paso 2: Activa el complemento haciendo clic en el símbolo de la garrapata que aparece junto a él y después del botón OK en la columna de la derecha.

Paso 3: Si has conseguido activarlo correctamente, aparecerá un botón de "Análisis de datos" en el menú superior de tu hoja de cálculo, a la derecha.

Paso 4: Haz clic en el botón "Análisis de datos" y elige la opción "Prueba t: Dos Muestras Emparejadas para Medias". A continuación, haz clic en Aceptar. Aparecerá una nueva ventana.

Paso 5: Te pedirá las entradas en la primera fila de la ventana. Escribe C4: C13 en la casilla "rango de la variable 1". Escribe D4: D13 en la casilla "rango de la variable 2". Deja la casilla alfa con su valor por defecto.

Paso 6: En la segunda fila de la ventana puedes seleccionar dónde controlar tus resultados. Puede ser una nueva hoja de cálculo o cualquier celda en blanco. Si quieres el resultado en una celda, asegúrate de bloquear la columna y la fila. Después, haz clic en el botón Aceptar.

Tip: Use the dollar sign before the letter and number to lock the column and row. For example, if you want to lock A2 cell you type $A$2.

Paso 7: El Excel calculará la media, la varianza, las observaciones, la correlación de Pearson, la diferencia de medias hipotéticas, el estadístico t, el valor p, etc.

¨Conclusión

El valor P es fácil de calcular y de adaptar en muchas situaciones diferentes. Te ayuda a obtener la información que necesitas sin dedicarle mucho tiempo ni esfuerzo. Es incluso más fácil de calcular cuando utilizas programas de análisis estadístico como Microsoft Excel que vienen con las herramientas y fórmulas adecuadas.