ESTUDIO CONJUNTO DE DOS VARIABLES.

A la derecha tenemos una posible manera de recoger los datos obtenidos observando dos variables en varios individuos de una muestra.

  •  En cada fila tenemos los datos de un individuo.
  •  Cada columna representa los valores que toma una variable sobre los mismos.
  •  Los individuos no se muestran en ningún orden particular.
  • Dichas observaciones pueden ser representadas en un diagrama de dispersión (scatterplot). En ellos, cada individuo es un punto cuyas coordenadas son los valores de las variables. 
  • Nuestro objetivo será intentar reconocer a partir del mismo si hay relación entre las variables, de qué tipo, y si es posible predecir el valor de una de ellas en función de la otra.

En el eje X coloco la variable independiente.


RELACIÓN DIRECTA E INVERSA:
Introducción a la Inferencia Estadística - ppt descargar


REGRESIÓN LINEAL SIMPLE: CORRELACIÓN Y DETERMINACIÓN.

Se trata de estudiar la asociación lineal entre dos variables cuantitativas.

Todo parte de la ecuación de la recta: y=ax+b (ej: TAS =a x edad + b)

  •  La pendiente de la recta a= B1, cuanto más negativa sea, más decreciente es la recta.
  •  Punto de intersección con el eje de coordenadas b = B0.
  •  B1 expresa la cantidad de cambio que se produce en la variable dependiente por unidad de cambio de la variable independiente. Se refiere a cuanto sube la tensión arterial cuando la persona aumenta un año la edad.
  •  B0 expresa cual es el valor de la variable dependiente cuando la independiente vale 0.

La recta no es un modelo lineal determinista, es probabilístico: para cada valor de la variable independiente existe una distribución de probabilidad de valores de la dependiente. Con una probabilidad entre 0 y 1.

La recta a determinar es aquella con la menor distancia de cada punto a ella.

Hay dos tipos de coeficientes, se elige uno u otro dependiendo de si las variables siguen una distribución normal:


ANÁLISIS DE CORRELACIÓN:

El análisis de correlación se utiliza con el propósito de disponer de un indicador cuantitativo que permite sintetizar el grado de la asociación entre variables.

Coeficiente de Correlación r de Pearson (r), (Rxy): Es un coeficiente que mide el grado de la relación de dependencia que existe entre las variables (x,y), cuyos valores van desde -1, correspondiente a una correlación negativa perfecta, hasta 1, correspondiente a una correlación positiva perfecta.

El coeficiente de correlación por Rango de o rho de Spearman es una medida de asociación que requiere que ambas variables en estudio sean medidas por lo menos en una escala ordinal.



¿CÓMO COMRPOBAR LA NORMALIDAD DE LOS DATOS?

Epi Info nos muestra un histograma donde vemos si la gráfica sigue una distribución normal o no.

Los métodos más fiables son pruebas estadísticas, hay dos:
  •  Prueba de kolmogorov-smirnov: Si el tamaño muestral es grande.
  •  Prueba de shapiro-wilk: Si el tamaño muestral es pequeño, si tiene menos o igual de 50.
Para las pruebas de normalidad: si p0,05 es normal. Se compara con unos valores que nos da un programa.

COEFICIENTE DE PEARSON:

Y= B1 *x + B0 (Determinista)


Y= B1 *x + B0 + e1 (Probabilista)



CÓMO CALCULAR B1 Y B0:

14 Introducción al Análisis de Correlación y de Regresión Lineal ...



















Comentarios

Entradas populares