miércoles, 10 de noviembre de 2010

ESTADISTICA

1.- Conceptos básicos de estadística
1.1 P   anorama general
- Datos: observaciones recolectadas (mediciones, géneros, respuestas)
- Poblacion: colección completa de todos los elementos a estudiar.
- Muestra: Subconjunto de miembros seleccionados de una población.
* Parámetro: medición numérica que describe algunas características de la población.
* Estadístico: medición numérica que describe algunas características de la muestra.
- Datos cualitativos y cuantitativos
* Discretos (finito)
* Continuos (infinito)
1.2.- Diseño de experimentos
- Observacional: se observan y miden características especificas, aunque no intentemos manipular a los sujetos estudiados.
- Experimental: se aplica algún  tratamiento y se observa el efecto en los sujetos.
1.3 Estudios
* Transaccional: los datos se observan, se miden y reúnen en un solo momento.
* Retrospectivo: los datos se toman del pasado (registros, entrevistas...)
* Prospectivos (longitudinal de cohorte) los datos se reúnen en el futuro y se toman en grupos (llamados cohortes)  que comparten factores comunes.
La confusión ocurre en un experimento cuando el experimentador no es capaz de distinguir entre los efectos de diferentes factores.
·         Se recomienda diseñar un experimento de manera que no presenta confusión.

1.4 Variables

Todo aquello que es susceptible de estudiarse.

-       Dependiente
-        Independiente.


2.- Descripción, exploración y composición de datos.

2.1 Características importantes de los datos.

-       Centro: valor representativo o promedio que indica la colocación de la mitad del conjunto de datos.

-       Variación: medida de la cantidad en que los valores de los datos varían entre si.

-       Distribución: Naturaleza o forma de la distribución de los datos (normales, uniformes o segmentados)

a)    Distribución de frecuencias

Lista de valores o datos (individual o por grupo de intervalos) junto con sus frecuencias ( o conteos) correspondientes.

·         Definiciones

Limite de clase inferior: cifras más pequeñas que pueden pertenecer a la misma clase.
Limite clase superior: cifras más altas que pueden pertenecer a la misma clase.
Fronteras de clase: cifras utilizadas pára separar las clases sin los espacios cerrados por los limites de clase.
Marca de clase: puntos medios de las clases.
Anchura: diferencia entre 2 limites de clase consecutivos.

3.- Distribución de frecuencias (paso previo a la grafica o histograma)

3.1 Características

 - Resume conjuntos grandes de datos.
- Permite cierta comprensión respecto a la naturaleza de los datos.
- Es la base de la construcción de graficas.

3.1.1 Pasos para la formación de una grafica.

a)    Elija el numero de clases (  5 a 20; números enteros o redondeados )
b)    Anchura de clase: valor mas alto menos el valor mas bajo, entre el numero de clases (redondear)
c)     Punto de partida: elegir el numero para el limite inferior de la primera clase.

·         Elija el valor de fatos mas bajo, o un valor convenientemente mas pequeño.

d)    Construya el limite superior usando el ancho de clase.
e)    Ponga sus datos en columnas verticales
f)     Construya su tabla.

3.2 Distribución de frecuencia relativa.
Se obtiene al dividir la frecuencia de clase, entre la suma de todas las frecuencias.
3.3 Distribución de frecuencias acumulativas
4.- Visualización de datos.
4.1 Grafica
Dibujo de distribuciones.
a)    Histograma. Grafica de barras donde la escala horizontal representando clase de valores de datos y la vertical, las frecuencias. Las alturas de las barras corresponden a los valores de las frecuencias y estas se dibujan sin espacios adyacentes.
b)    Polígono de frecuencias. Segmentos lineales colocados a puntos directamente proporcionales de la marca de clase.-
c)    Ojiva. Grafica lineal que representa las frecuencias acumulativas.
d)    Graficas circulares. (%)
·         Determinan el número de valores por debajo de un valor particular.

Distribución de dispersión (grafica de datos pareados X, Y)

Un diagrama de dispersión es una grafica de datos apareados (x,y) con un eje x horizontal y un eje y vertical. Los datos se aparean de tal forma que cada valor de un conjunto de datos corresponden a un valor de un segundo conjunto de datos.

5.- Medidas de tendencia central

5.1 Definición

Una medida de tendencia central es aquel valor que se encuentra en el centro o a la mitad de un conjunto de datos.

Hay muchas formas de determinar el centro; por lo tanto tenemos diferentes definiciones, incluyendo media, mediana y moda.

5.1.1 Media (promedio)

Se obtiene al sumar todos los puntajes entre el total de los mismos.

5.1.2 Mediana (de un conjunto de datos)

Implica el valor que esta en medio, cuando los valores originales de los datos se presentan en orden de magnitud creciente (o decreciente).

5.1.3 Moda (conjunto de datos que suele denominarse como M)

Valor que ocurre con mayor frecuencia

a)    Cuando 2 vcalores ocurren con la misma frecuencia y esta es la mas alta, ambos valores son modas, por lo tanto el conjunto de datos es bimodal.

b)    Cuando mas de 2 valores ocurren con la misma frecuencia y esta es la mas alta, todos los calores son modas, por lo tanto el conjunto de datos es multimodal.

c)    Cuando ningún valor se repite, se dice que no hay moda.

5.1.4 Mitad del rango
Constituye el valor que esta a medio camino, entre el puntaje mas alto y el mas bajo, en el conjunto original de datos. Se calcula sumando el valor máximo con el mínimo y luego dividiéndolos entre 2.

5.2 Media de una distribución de frecuencias.
Cuando los datos se resumen en una distribución de frecuencias es probable que no conozcamos los valores exactos de una clase en particular. Para ello se emplean las siguientes formulas:

5.2.1 Media ponderada
En algunos casos los valores varían su grado de importancia, de modo que es posible que queramos acomodarlos de acuerdo a ello, para esto se procede al cálculo por medio de una media ponderada:
5.2.3 Comparación de la media, mediana, moda y mitad del rango.
5.3 Sesgo
Una distribución esta sesgada si no es simétrica y se extiende mas hacia un lado que hacia otro (es simétrica si las mitades se miran como en espejo)
Si se sesga a la izquierda es negativa (la media y la mediana se tiran hacia este lado). Caso contrario (a la derecha) es positivo.




























No hay comentarios:

Publicar un comentario