viernes, 20 de abril de 2012

UNIDAD I


UNIDAD I

Conceptos Básicos y Estadística Descriptiva

Concepto de Estadística:

Cuando coloquialmente se habla de estadística, se suele pensar en una relación de datos numéricos presentada de forma ordenada y sistemática. Esta idea es la consecuencia del concepto popular que existe sobre el término y que cada vez está más extendido debido a la influencia de nuestro entorno, ya que hoy día es casi imposible que cualquier medio de difusión, periódico, radio, televisión, etc, no nos aborde diariamente con cualquier tipo de información estadística sobre accidentes de tráfico, índices de crecimiento de población, turismo, tendencias políticas, etc.

Sólo cuando nos adentramos en un mundo más específico como es el campo de la investigación de las Ciencias Sociales: Medicina, Biología, Psicología, ... empezamos a percibir que la Estadística no sólo es algo más, sino que se convierte en una herramienta que, hoy por hoy, permite dar luz y obtener resultados, y por tanto beneficios, en cualquier tipo de estudio, cuyos movimientos y relaciones, por su variabilidad intrínseca, no puedan ser abordadas desde la perspectiva de las leyes determistas. Podríamos, desde un punto de vista más amplio, definir la estadística como la ciencia que estudia cómo debe emplearse la información y cómo dar una guía de acción en situaciones prácticas que entrañan incertidumbre.

Desde este punto de vista, se puede concluir que la estadística se define como un conjunto de métodos para manejar la obtención, presentación y análisis de observaciones numéricas, cuyos fines son describir al conjunto de datos obtenidos y tomar decisiones o realizar generalizaciones acerca de las características de todas las observaciones bajo consideración.

La estadística es una ciencia que estudia la recolección, análisis e interpretación de datos, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo estadística es más que eso, en otras palabras es el vehículo que permite llevar a cabo el proceso relacionado con la investigación científica. (http://es.wikipedia.org/wiki/Estad%C3%ADstica)

Áreas que conforman a la Estadística:

Estadística Descriptiva (Deductiva): es la encargada de la organización, condensación, presentación de los datos en tablas y gráficos y del cálculo de medidas numéricas que permitan estudiar los aspectos más importantes de los datos.

Estadística Inferencial o Inferencia Estadística: está definida por un conjunto de técnicas, mediante las cuales se hacen generalizaciones o se toman decisiones en base a información parcial obtenida mediante técnicas descriptivas.

Áreas de Aplicación de la Estadística:
El uso de la Estadística es muy amplio. Resulta difícil nombrar un área en la cual no se emplee.

Los métodos estadísticos han encontrado aplicación en:
l  Gobierno
l  Negocios
l  Ciencias Sociales
l  Ingeniería
l  Ciencias Física y Naturales
l  Control de Calidad
l  Procesos de Manufactura
l  Muchos otros campos de la actividad intelectual.

Esto se debe a la creciente facilidad con la cual se pueden manejar grandes cantidades de datos numéricos, debido al uso de …

Conceptos de Población y Muestra

Población: es la colección de todas las posibles mediciones u observaciones que pueden hacerse de una variable bajo estudio.


Se clasifica en dos categorías:

Finita: es aquella que incluye una cantidad limitada contable de observaciones, individuos o medidas. Siempre que sea posible alcanzar (contar) el número total de todas las posibles mediciones, se considera como finita la población. Ejemplos: Número de alumnos de la Universidad de Oriente, trabajadores de una empresa, clientes de una determinada empresa, etc.

Infinita: es aquella que incluye un gran conjunto de observaciones o mediciones que no pueden alcanzarse por conteo. Al menos, hipotéticamente, no existe límite en cuanto al número de observaciones que el experimento puede generar. Ejemplos: Número de peces en el mar, bacterias en un organismo, flores silvestres, etc.

Muestra:

Es un conjunto de mediciones u observaciones tomadas a partir de una población.

Es un subconjunto de la población. Este grupo  representa una parte de los sujetos que forman  la población, los cuales se pueden escoger de manera aleatoria o intencional, solo el primero de ellos será estudiado en este curso. Ejemplos: Número de alumnos en el salón de clases que estudian Licenciatura en Educación, profesores del  Núcleo de Sucre de la Universidad de Oriente, etc.



Tipos de datos y escalas de medida

Variables: Una variable es una característica que al ser medida en diferentes individuos es susceptible de adoptar diferentes valores. En estadística una variable se representa con un símbolo (x, y, h, B, etc.) que puede tomar un valor cualquiera de un conjunto determinado de ellos, llamado dominio de la variable. Si la variable puede tomar solamente un valor, se le llama constante. son las características o lo que se estudia de cada individuo de la muestra. Ej: sexo, edad, peso, estatura, color de ojos, estado civil, temperatura, cantidad de nacimientos, presión, grosor, diámetro, ...

Datosson los valores que toma la variable en cada caso.

Tipos de variables:


Variables Cualitativa: 
Las variables categóricas resultan de registrar la presencia de un atributo.
 
Las categorías de una variable cualitativa deben ser definidas claramente durante la etapa de diseño de la investigación y deben ser mutuamente excluyentes y exhaustivas. Esto significa que cada unidad de observación debe ser clasificada sin ambigüedad en una y solo una de las categorías posibles y que existe una categoría para clasificar a todo individuo.

En este sentido, es importante contemplar todas las posibilidades cuando se construyen variables categóricas, incluyendo una categoría tal como No sabe / No contesta, o No registrado u Otras, que asegura que todos los individuos observados serán clasificados con el criterio que define la variable.


Las variables categóricas solo toman valores asociados a las cualidades o atributos, clasificándolos en una de varias categorías, es decir, no son valores numéricos. Las categorías pueden tener un orden natural (ordinales) o no (nominales). Las variables cualitativas también se llaman variables categóricas. Con estas variables se pueden contar número de casos, comparar entre categorías, pero no se pueden  realizar operaciones numéricas.

Ejemplos:
  • Sexo: f/m.
  • Hábito de fumar: Fumador/No fumador
  • Color de ojos: negro, azul, marrón, …
  • Religión: católica, evangélica, …
  • Estado civil: soltero, casado, divorciado,…



Variables Cuantitativas: Tienen valores numéricos que representan medidas (largo, peso, etc.) o frecuencias (número de). Tiene sentido realizar operaciones numéricas con estas variables. Además distinguimos dentro de las variables cuantitativas las discretas y las continuas. Una variable discreta es aquella en la cuál se puede contar el número posible de valores. Una variable continua puede tomar cualquier valor en un intervalo dado.

Ejemplos:
  •    Peso.
  •    Edad.
  •    Estatura.
  •    Presión.
  •    Humedad.
  •    Intensidad de un sismo.
  •    Cantidad de hermanos.
Las variables Cuantitativas puden clasificarse en:

Variables Discreta: Es aquella cuyos valores pueden ponerse en correspondencia con los números naturales (N:1,2,3,4,...) o con parte de ellos. Es decir, los valores de la variable pueden contarse. también se puede decir que en la variable discreta se llega a algunos valores por ejemplo A y B de manera tal que entre esos dos valores no existe otro valor de la variable. Llega un momento en la que se producen saltos entre los valores de la variable.



Este tipo de variable sólo puede tomar un cierto conjunto de valores posibles. En general, aparecen por conteo.


Ejemplo: 

  •     cantidad de hermanos.
  •     número de miembros del hogar
  •     número de intervenciones quirúrgicas
  •     número de casos notificados de una cierta patología


Variables Continuas: Generalmente son el resultado de una medición que se expresa en unidades. Las mediciones pueden tomar teóricamente un conjunto infinito de valores posibles dentro de un rango. En la práctica los valores posibles de la variable están limitados por la precisión del método de medición o por el modo de registro.


Una variable "x" es continua si cumple con la siguiente  condición: Valores que puede toar la variable (A y B). Siempre es posible encontrar un tercer valor C, comprendido entre A y B, el cual, teóricamente, también puede ser asumido por la variable. Como este procedimiento puede repetirse reiterada y consecutivamente de manera indefinida, entonces la condición anterior equivale a la siguiente premisa. Dado dos valores A y B de la variable, siempre es posible que la variable "x" tome cualquier valor comprendido entre A y B. Es decir, podemos ir desde A hasta B y tener la seguridad que a cada punto le corresponde un valor de la misma variable. 

Ejemplo: 

  •     cantidad de líquido contenido en un recipiente.
  •     altura
  •     peso.
  •     pH.
  •     nivel de colesterol en sangre.



La distinción entre datos discretos y continuos es importante para decidir qué método de análisis estadístico utilizar, ya que hay métodos que suponen que los datos son continuos. 

Consideremos por ejemplo, la variable edad. Edad es continua, pero si se la registra en años resulta ser discreta. En estudios con adultos, en que la edad va de 20 a 70 años, por ejemplo, no hay problemas en tratarla como continua, ya que el número de valores posibles es muy grande. Pero en el caso de niños en edad preescolar,  si la edad se registra en años debe tratarse como iscreta, en tanto que si se la registra en meses puede tratarse como continua.

Del mismo modo, la variable número de pulsaciones/min. es una variable discreta, pero se la trata como continua debido al gran número de valores posibles. 

Los datos numéricos (discretos o continuos) pueden ser transformados en categóricos y ser tratados como tales. Aunque esto es correcto no necesariamente es eficiente y siempre es preferible registrar el valor numérico de la medición, ya que esto permite:
  •   Analizar la variable como numérica  ⇒ Análisis estadístico más simple y más potente.
  •     Armar nuevas categorías usando criterios diferentes.

Nota:
N°1) 
Una variable que teóricamente puede tomar cualquier valor entre dos valores dados se le llama variable continua. si no es así se le llama discreta.


N°2) 
Los datos que vienen definidos por una variable discreta o continua se llaman datos discretos o continuos respectivamente. El número de hijos en cada una de 1.000 familias es un ejemplo de datos discretos, mientras que las alturas de 100 universitarios es un ejemplo de datos continuos.

SENSIBILIDAD (ESTADÍSTICA):

La sensibilidad en estadística (S), es definida por la menor unidad de medida en la cual son representados o reportados los valores de una variable.
La forma en que se muestran los datos dan luces del valor de la sensibilidad. Revisemos el siguiente ejemplo:
Sean los siguientes valores reportados:


Xi: 12  14  19  21  23 9  17 32 18  22  19 11 18 


S=1


nótese que todos los datos son números enteros y por tanto contables, los cuales se pueden poner en correspondencia con el conjunto de los números naturales (N), cuya menor unidad de medida es 1. Esto significa que podemos construir todos los números de la serie Xi sumando de uno en uno hasta obtener cada uno de los valores reportados. Miremos ahora la siguiente serie de datos:


Yi: 12,4  14,1  19,0  21,7  23,6  9,8  17,2  32,9  18,3


En la serie Yi los valores reportados son medidos de tal manera que los valores no se obtienen sumando de uno en uno, como en el caso de la serie anterior (Xi), sino que ha utilizado una unidad de medida mas pequeña, tan pequeña como el número de decimales que pueda poseer alguno de los valores reportados. En este caso todos los valores reportados tienen un decimal, por lo que se puede afirmar que la sensibilidad de la serie de datos Yi es igual a 1 (S=0,1)


NOTA:
La sensibilidad en la escala de medición de una variable continua NO se puede precisar si el valor medido (valor reportado) de la variable, coincide con el valor real (valor verdadero) de la variable.


Esto significa que dado el valor reportado siempre queda la duda de la ubicación del valor verdadero. Por consiguiente, es necesario colocar algunos límites para el valor verdadero de la variable y esto último tiene que ver con la sensibilidad de la medición de la variable continua.


CÁLCULO DE LOS LÍMITES VERDADEROS DE UNA VARIABLE CONTINUA


Límite Inferior: 
Se obtiene restándole la mitad de la sensibilidad (s) al valor reportado (Vr) de la variable:


Lim. Inf.= Vr - S/2


Límite Superior:
Se obtiene sumándole la mitad de la sensibilidad (s) al valor reportado (Vr) de la variable:


Lim. Sup.= Vr + S/2


Ejemplo:


Determine el valor de los limites inferiores y superiores del valor reportado 35 (Vr=35), sabiendo que el valor de la sensibilidad es 3 (S=3).


Lim. Inf.= Vr - S/2 = 35 - 3/2 = 35 - 1,5 = 33,5


Lim. Inf.= 33,5 


Lim. Sup.= Vr + S/2 = 35 + 3/2 = 35 + 1,5 = 36,5


Lim. Sup.= 36,5


/                     /                      /
33,5              35                     36,5
Lim. inf.         Vr                  Lim. sup.

ESCALAS DE MEDICIÓN

Llamaremos medición al proceso de atribuir números a las variables. El conjunto de reglas o modelos desarrollados para la asignación de números a las variables es lo que se denomina escala. La clasificación de las escalas más usada es la propuesta por Stevens (1946) que divide las escalas en: nominales, ordinales, de intervalo y de razón.

Escala nominal: nos permite identificar sujetos como "iguales" o "diferentes". Usando una escala nominal podemos decidir si un sujeto es igual o diferente a otro, pero no podemos establecer relaciones de orden respecto a esa característica, ni relaciones de cantidad ni de diferencia. Por ejemplo: si medimos el color de los ojos podemos establecer la siguiente escala: A azul, V verde, M marrón y N negro. No podemos ordenar los sujetos de mayor a menor o viceversa, simplemente podemos asegurar si dos sujetos tienen el mismo o distinto color de ojos. Otros ejemplos: nacionalidad, sexo, profesión. A este tipo de variables medidas con escala nominal se les puede asignar a cada categoría cualquier tipo de símbolos. En el ejemplo hemos asignado letras pero podíamos haber optado por números: 1 azul, 2 verde, 3 marrón y 4 negro.


Escala ordinal: Esta escala no sólo permite la identificación y diferenciación de los sujetos sino que además permite establecer relaciones del tipo "mayor que" o "menor que". Es decir, de los sujetos se puede decir cual presenta una mayor o menor magnitud de la característica medida, los objetos se pueden ordenar. Ejemplo: nivel de estudios se puede asignar 1 a estudios primarios, 2 a estudios secundarios, 3 a estudios universitarios. Podemos ordenar a los sujetos según el nivel de estudios, el valor 3 es mayor que el 2 y el 1. Aunque no podemos afirmar que la diferencia existente entre el 2 y el 1 sea la misma que la que existe entre el 3 y el 2. Ni que el que tenga nivel 3 tenga 3 veces más de nivel de estudios que el que tiene nivel 1. Otros ejemplos de escala ordinal: posición relativa en la clase, escala de dureza de los minerales.

Escala de intervalo: Con esta escala, además de poder identificar un objeto y establecer relaciones del tipo mayor que y menor que, también podemos hacer afirmaciones acerca de las diferencias en la cantidad del atributo de unos y otros objetos. Es decir, disponemos de una unidad de medida, aunque en este caso el cero sea un punto arbitrario en la escala. Es decir, no indica ausencia total de la cantidad de atributo. Un ejemplo típico es el calendario, podemos afirmar que ha transcurrido el mismo tiempo entre 1960 y 1966 que entre 1980 y 1986 porque contamos con una unidad de medida llamada año. Pero no podemos afirmar que hasta el año 1000 haya pasado el doble de tiempo que hasta el año 500, porque el valor cero no representa el comienzo del tiempo sino que, en nuestro calendario se eligió el año del nacimiento de Cristo como año 1. Otros ejemplos: la medición de las temperaturas en grados Celcius la escala de los test de inteligencia.



Escala de razón: También se llama de proporción o de cociente. Además de las características de las otras tres escalas, contamos con una unidad de medida con cero absoluto, es decir, que significa ausencia del atributo o característica medida. Por ejemplo, la longitud, podemos afirmar que un objeto que mide 10 cm. tiene el doble de longitud que uno que mide 5 cm. Otros ejemplos: peso, duración de un suceso, temperatura en grados Kelvin (que sí tiene cero absoluto).





No hay comentarios:

Publicar un comentario