UNIDAD I
Conceptos de Población y Muestra
Se clasifica en dos categorías:
En este sentido, es
importante contemplar todas las posibilidades cuando se construyen variables
categóricas, incluyendo una categoría tal como No sabe / No contesta, o No registrado
u Otras, que asegura que todos los individuos observados serán clasificados con
el criterio que define la variable.
Las variables categóricas solo toman valores asociados a las cualidades o atributos, clasificándolos en una de varias categorías, es decir, no son valores numéricos. Las categorías pueden tener un orden natural (ordinales) o no (nominales). Las variables cualitativas también se llaman variables categóricas. Con estas variables se pueden contar número de casos, comparar entre categorías, pero no se pueden realizar operaciones numéricas.
Nota:
Sean los siguientes valores reportados:
Xi: 12 14 19 21 23 9 17 32 18 22 19 11 18
S=1
nótese que todos los datos son números enteros y por tanto contables, los cuales se pueden poner en correspondencia con el conjunto de los números naturales (N), cuya menor unidad de medida es 1. Esto significa que podemos construir todos los números de la serie Xi sumando de uno en uno hasta obtener cada uno de los valores reportados. Miremos ahora la siguiente serie de datos:
Yi: 12,4 14,1 19,0 21,7 23,6 9,8 17,2 32,9 18,3
En la serie Yi los valores reportados son medidos de tal manera que los valores no se obtienen sumando de uno en uno, como en el caso de la serie anterior (Xi), sino que ha utilizado una unidad de medida mas pequeña, tan pequeña como el número de decimales que pueda poseer alguno de los valores reportados. En este caso todos los valores reportados tienen un decimal, por lo que se puede afirmar que la sensibilidad de la serie de datos Yi es igual a 1 (S=0,1)
NOTA:
La sensibilidad en la escala de medición de una variable continua NO se puede precisar si el valor medido (valor reportado) de la variable, coincide con el valor real (valor verdadero) de la variable.
Esto significa que dado el valor reportado siempre queda la duda de la ubicación del valor verdadero. Por consiguiente, es necesario colocar algunos límites para el valor verdadero de la variable y esto último tiene que ver con la sensibilidad de la medición de la variable continua.
CÁLCULO DE LOS LÍMITES VERDADEROS DE UNA VARIABLE CONTINUA
Límite Inferior:
Se obtiene restándole la mitad de la sensibilidad (s) al valor reportado (Vr) de la variable:
Lim. Inf.= Vr - S/2
Límite Superior:
Se obtiene sumándole la mitad de la sensibilidad (s) al valor reportado (Vr) de la variable:
Lim. Sup.= Vr + S/2
Ejemplo:
Determine el valor de los limites inferiores y superiores del valor reportado 35 (Vr=35), sabiendo que el valor de la sensibilidad es 3 (S=3).
Lim. Inf.= Vr - S/2 = 35 - 3/2 = 35 - 1,5 = 33,5
Lim. Inf.= 33,5
Lim. Sup.= Vr + S/2 = 35 + 3/2 = 35 + 1,5 = 36,5
Lim. Sup.= 36,5
/ / /
33,5 35 36,5
Lim. inf. Vr Lim. sup.
Escala nominal: nos permite identificar sujetos como "iguales" o "diferentes". Usando una escala nominal podemos decidir si un sujeto es igual o diferente a otro, pero no podemos establecer relaciones de orden respecto a esa característica, ni relaciones de cantidad ni de diferencia. Por ejemplo: si medimos el color de los ojos podemos establecer la siguiente escala: A → azul, V → verde, M → marrón y N → negro. No podemos ordenar los sujetos de mayor a menor o viceversa, simplemente podemos asegurar si dos sujetos tienen el mismo o distinto color de ojos. Otros ejemplos: nacionalidad, sexo, profesión. A este tipo de variables medidas con escala nominal se les puede asignar a cada categoría cualquier tipo de símbolos. En el ejemplo hemos asignado letras pero podíamos haber optado por números: 1 → azul, 2 → verde, 3 → marrón y 4 → negro.
Conceptos
Básicos y Estadística Descriptiva
Concepto de Estadística:
Cuando coloquialmente se habla de estadística, se suele pensar en
una relación de datos numéricos presentada de forma ordenada y sistemática.
Esta idea es la consecuencia del concepto popular que existe sobre el término y
que cada vez está más extendido debido a la influencia de nuestro entorno, ya
que hoy día es casi imposible que cualquier medio de difusión, periódico,
radio, televisión, etc, no nos aborde diariamente con cualquier tipo de
información estadística sobre accidentes de tráfico, índices de crecimiento de
población, turismo, tendencias políticas, etc.
Sólo cuando nos adentramos en un mundo más específico como es el
campo de la investigación de las Ciencias Sociales: Medicina, Biología,
Psicología, ... empezamos a percibir que la Estadística no sólo es algo más,
sino que se convierte en una herramienta que, hoy
por hoy, permite dar luz y obtener resultados, y por tanto beneficios, en
cualquier tipo de estudio, cuyos movimientos y relaciones, por su variabilidad
intrínseca, no puedan ser abordadas desde la perspectiva de las leyes
determistas. Podríamos, desde un punto de vista más amplio, definir la
estadística como la ciencia que estudia cómo debe emplearse la información y
cómo dar una guía de acción en situaciones prácticas que entrañan incertidumbre.
Desde este punto de vista, se puede concluir que la
estadística se define como un conjunto de métodos para manejar la obtención,
presentación y análisis de observaciones numéricas, cuyos fines
son describir al conjunto de datos obtenidos y tomar decisiones o
realizar generalizaciones acerca de las características de todas las
observaciones bajo consideración.
La estadística es una
ciencia que estudia la recolección, análisis e interpretación de datos, ya sea
para ayudar en la toma de decisiones o para explicar condiciones regulares o
irregulares de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo estadística es más que eso, en otras
palabras es el vehículo que permite llevar a cabo el proceso relacionado con la
investigación científica. (http://es.wikipedia.org/wiki/Estad%C3%ADstica)
Áreas que
conforman a la Estadística:
Estadística
Descriptiva (Deductiva):
es la encargada de la organización, condensación, presentación de los datos en
tablas y gráficos y del cálculo de medidas numéricas que permitan estudiar los
aspectos más importantes de los datos.
Estadística Inferencial o Inferencia Estadística: está definida por un conjunto de técnicas, mediante
las cuales se hacen generalizaciones o se toman decisiones en base a
información parcial obtenida mediante técnicas descriptivas.
Áreas de Aplicación de la Estadística:
El uso de la Estadística es muy amplio. Resulta
difícil nombrar un área en la cual no se emplee.
Los métodos estadísticos han encontrado aplicación
en:
l Gobierno
l Negocios
l Ciencias Sociales
l Ingeniería
l Ciencias Física y Naturales
l Control de Calidad
l Procesos de Manufactura
l Muchos otros campos de la actividad intelectual.
Esto
se debe a la creciente facilidad con la cual se pueden manejar grandes
cantidades de datos numéricos, debido al uso de …
Población:
es la colección de todas las
posibles mediciones u observaciones que pueden hacerse de una variable bajo
estudio.
Se clasifica en dos categorías:
Finita: es aquella que incluye una cantidad limitada
contable de observaciones, individuos o medidas. Siempre que sea posible
alcanzar (contar) el número total de todas las posibles mediciones, se
considera como finita la población. Ejemplos: Número de alumnos de la Universidad de Oriente, trabajadores de una empresa, clientes de una determinada empresa, etc.
Infinita: es aquella que incluye un gran conjunto de
observaciones o mediciones que no pueden alcanzarse por conteo. Al menos,
hipotéticamente, no existe límite en cuanto al número de observaciones que el
experimento puede generar. Ejemplos: Número de peces en el mar, bacterias en un organismo, flores silvestres, etc.
Muestra:
Es
un subconjunto de la población. Este grupo representa una parte de los sujetos que forman la población, los cuales se pueden escoger de manera aleatoria o intencional, solo el primero de ellos será estudiado en este curso. Ejemplos: Número de alumnos en el salón de clases que estudian Licenciatura en Educación, profesores del Núcleo de Sucre de la Universidad de Oriente, etc.
Tipos
de datos y escalas de medida
Variables: Una variable es
una característica que al ser medida en diferentes individuos es
susceptible de adoptar diferentes valores. En estadística una variable se
representa con un símbolo (x, y, h, B, etc.) que puede tomar un valor
cualquiera de un conjunto determinado de ellos, llamado dominio de
la variable. Si la variable puede tomar solamente un valor, se le
llama constante. son las características o lo que se estudia de cada
individuo de la muestra. Ej: sexo, edad, peso, estatura, color de ojos, estado
civil, temperatura, cantidad de nacimientos, presión, grosor, diámetro, ...
Datos: son los valores que toma la variable en cada caso.
Tipos de variables:
Variables Cualitativa:
Las variables
categóricas resultan de registrar la presencia de un atributo.
Las categorías de una
variable cualitativa deben ser definidas claramente durante la etapa de diseño
de la investigación y deben ser mutuamente excluyentes y exhaustivas. Esto significa
que cada unidad de observación debe ser clasificada sin ambigüedad en una y solo
una de las categorías posibles y que existe una categoría para clasificar a todo
individuo.
Las variables categóricas solo toman valores asociados a las cualidades o atributos, clasificándolos en una de varias categorías, es decir, no son valores numéricos. Las categorías pueden tener un orden natural (ordinales) o no (nominales). Las variables cualitativas también se llaman variables categóricas. Con estas variables se pueden contar número de casos, comparar entre categorías, pero no se pueden realizar operaciones numéricas.
Ejemplos:
- Sexo: f/m.
- Hábito de fumar: Fumador/No fumador
- Color de ojos: negro, azul, marrón, …
- Religión: católica, evangélica, …
- Estado civil: soltero, casado, divorciado,…
Variables Cuantitativas: Tienen valores numéricos que representan medidas (largo, peso, etc.) o frecuencias (número de). Tiene sentido realizar operaciones numéricas con estas variables. Además distinguimos dentro de las variables cuantitativas las discretas y las continuas. Una variable discreta es aquella en la cuál se puede contar el número posible de valores. Una variable continua puede tomar cualquier valor en un intervalo dado.
Ejemplos:
- Peso.
- Edad.
- Estatura.
- Presión.
- Humedad.
- Intensidad de un sismo.
- Cantidad de hermanos.
Las variables Cuantitativas puden clasificarse en:
Variables Discreta: Es aquella cuyos valores pueden ponerse en correspondencia con los números naturales (N:1,2,3,4,...) o con parte de ellos. Es decir, los valores de la variable pueden contarse. también se puede decir que en la variable discreta se llega a algunos valores por ejemplo A y B de manera tal que entre esos dos valores no existe otro valor de la variable. Llega un momento en la que se producen saltos entre los valores de la variable.
Este tipo de variable sólo
puede tomar un cierto conjunto de valores posibles. En general, aparecen por
conteo.
Ejemplo:
- cantidad de hermanos.
- número de miembros del hogar
- número de intervenciones quirúrgicas
- número de casos notificados de una cierta patología
Variables Continuas: Generalmente son el
resultado de una medición que se expresa en unidades. Las mediciones pueden
tomar teóricamente un conjunto infinito de valores posibles dentro de un rango.
En la práctica los valores posibles de la variable están limitados por la
precisión del método de medición o por el modo de registro.
Una variable "x" es continua si cumple con la siguiente condición: Valores que puede toar la variable (A y B). Siempre es posible encontrar un tercer valor C, comprendido entre A y B, el cual, teóricamente, también puede ser asumido por la variable. Como este procedimiento puede repetirse reiterada y consecutivamente de manera indefinida, entonces la condición anterior equivale a la siguiente premisa. Dado dos valores A y B de la variable, siempre es posible que la variable "x" tome cualquier valor comprendido entre A y B. Es decir, podemos ir desde A hasta B y tener la seguridad que a cada punto le corresponde un valor de la misma variable.
Ejemplo:
- cantidad de líquido contenido en un recipiente.
- altura
- peso.
- pH.
- nivel de colesterol en sangre.
La distinción entre
datos discretos y continuos es importante para decidir qué método de análisis
estadístico utilizar, ya que hay métodos que suponen que los datos son
continuos.
Consideremos por
ejemplo, la variable edad. Edad es continua, pero si se la registra en años
resulta ser discreta. En estudios con adultos, en que la edad va de 20 a 70
años, por ejemplo, no hay problemas en tratarla como continua, ya que el número
de valores posibles es muy grande. Pero en el caso de niños en edad
preescolar, si la edad se registra en
años debe tratarse como iscreta, en tanto que si se la registra en meses puede
tratarse como continua.
Del mismo modo, la
variable número de pulsaciones/min. es una variable discreta, pero se la trata
como continua debido al gran número de valores posibles.
Los datos numéricos
(discretos o continuos) pueden ser transformados en categóricos y ser tratados
como tales. Aunque esto es correcto no necesariamente es eficiente y siempre es
preferible registrar el valor numérico de la medición, ya que esto permite:
- Analizar la variable como numérica ⇒ Análisis estadístico más simple y más potente.
- Armar nuevas categorías usando criterios diferentes.
N°1)
Una variable que teóricamente puede tomar cualquier valor entre dos valores dados se le llama variable continua. si no es así se le llama discreta.
N°2)
Los datos que vienen definidos por una variable discreta o continua se llaman datos discretos o continuos respectivamente. El número de hijos en cada una de 1.000 familias es un ejemplo de datos discretos, mientras que las alturas de 100 universitarios es un ejemplo de datos continuos.
SENSIBILIDAD (ESTADÍSTICA):
La sensibilidad en estadística (S), es definida por la menor unidad de medida en la cual son representados o reportados los valores de una variable.
La forma en que se muestran los datos dan luces del valor de la sensibilidad. Revisemos el siguiente ejemplo:Sean los siguientes valores reportados:
Xi: 12 14 19 21 23 9 17 32 18 22 19 11 18
S=1
nótese que todos los datos son números enteros y por tanto contables, los cuales se pueden poner en correspondencia con el conjunto de los números naturales (N), cuya menor unidad de medida es 1. Esto significa que podemos construir todos los números de la serie Xi sumando de uno en uno hasta obtener cada uno de los valores reportados. Miremos ahora la siguiente serie de datos:
Yi: 12,4 14,1 19,0 21,7 23,6 9,8 17,2 32,9 18,3
En la serie Yi los valores reportados son medidos de tal manera que los valores no se obtienen sumando de uno en uno, como en el caso de la serie anterior (Xi), sino que ha utilizado una unidad de medida mas pequeña, tan pequeña como el número de decimales que pueda poseer alguno de los valores reportados. En este caso todos los valores reportados tienen un decimal, por lo que se puede afirmar que la sensibilidad de la serie de datos Yi es igual a 1 (S=0,1)
NOTA:
La sensibilidad en la escala de medición de una variable continua NO se puede precisar si el valor medido (valor reportado) de la variable, coincide con el valor real (valor verdadero) de la variable.
Esto significa que dado el valor reportado siempre queda la duda de la ubicación del valor verdadero. Por consiguiente, es necesario colocar algunos límites para el valor verdadero de la variable y esto último tiene que ver con la sensibilidad de la medición de la variable continua.
CÁLCULO DE LOS LÍMITES VERDADEROS DE UNA VARIABLE CONTINUA
Límite Inferior:
Se obtiene restándole la mitad de la sensibilidad (s) al valor reportado (Vr) de la variable:
Lim. Inf.= Vr - S/2
Límite Superior:
Se obtiene sumándole la mitad de la sensibilidad (s) al valor reportado (Vr) de la variable:
Lim. Sup.= Vr + S/2
Ejemplo:
Determine el valor de los limites inferiores y superiores del valor reportado 35 (Vr=35), sabiendo que el valor de la sensibilidad es 3 (S=3).
Lim. Inf.= Vr - S/2 = 35 - 3/2 = 35 - 1,5 = 33,5
Lim. Inf.= 33,5
Lim. Sup.= Vr + S/2 = 35 + 3/2 = 35 + 1,5 = 36,5
Lim. Sup.= 36,5
/ / /
33,5 35 36,5
Lim. inf. Vr Lim. sup.
ESCALAS DE MEDICIÓN
Llamaremos
medición al proceso de atribuir números a las variables. El conjunto de reglas
o modelos desarrollados para la asignación de números a las variables es lo que
se denomina escala. La clasificación de las escalas más usada es la propuesta
por Stevens (1946) que divide las escalas en: nominales, ordinales, de
intervalo y de razón.
Escala nominal: nos permite identificar sujetos como "iguales" o "diferentes". Usando una escala nominal podemos decidir si un sujeto es igual o diferente a otro, pero no podemos establecer relaciones de orden respecto a esa característica, ni relaciones de cantidad ni de diferencia. Por ejemplo: si medimos el color de los ojos podemos establecer la siguiente escala: A → azul, V → verde, M → marrón y N → negro. No podemos ordenar los sujetos de mayor a menor o viceversa, simplemente podemos asegurar si dos sujetos tienen el mismo o distinto color de ojos. Otros ejemplos: nacionalidad, sexo, profesión. A este tipo de variables medidas con escala nominal se les puede asignar a cada categoría cualquier tipo de símbolos. En el ejemplo hemos asignado letras pero podíamos haber optado por números: 1 → azul, 2 → verde, 3 → marrón y 4 → negro.
Escala
ordinal: Esta escala no
sólo permite la identificación y diferenciación de los sujetos sino que además
permite establecer relaciones del tipo "mayor que" o "menor
que". Es decir, de los sujetos se puede decir cual presenta una mayor o
menor magnitud de la característica medida, los objetos se pueden ordenar.
Ejemplo: nivel de estudios se puede asignar 1 a estudios primarios, 2 a
estudios secundarios, 3 a estudios universitarios. Podemos ordenar a los
sujetos según el nivel de estudios, el valor 3 es mayor que el 2 y el 1. Aunque
no podemos afirmar que la diferencia existente entre el 2 y el 1 sea la misma
que la que existe entre el 3 y el 2. Ni que el que tenga nivel 3 tenga 3 veces
más de nivel de estudios que el que tiene nivel 1. Otros ejemplos de escala
ordinal: posición relativa en la clase, escala de dureza de los minerales.
Escala de
intervalo: Con esta escala,
además de poder identificar un objeto y establecer relaciones del tipo mayor
que y menor que, también podemos hacer afirmaciones acerca de las diferencias
en la cantidad del atributo de unos y otros objetos. Es decir, disponemos de
una unidad de medida, aunque en este caso el cero sea un punto arbitrario en la
escala. Es decir, no indica ausencia total de la cantidad de atributo. Un ejemplo
típico es el calendario, podemos afirmar que ha transcurrido el mismo tiempo
entre 1960 y 1966 que entre 1980 y 1986 porque contamos con una unidad de
medida llamada año. Pero no podemos afirmar que hasta el año 1000 haya pasado
el doble de tiempo que hasta el año 500, porque el valor cero no representa el
comienzo del tiempo sino que, en nuestro calendario se eligió el año del
nacimiento de Cristo como año 1. Otros ejemplos: la medición de las
temperaturas en grados Celcius la escala de los test de inteligencia.
Escala de
razón: También se llama de
proporción o de cociente. Además de las características de las otras tres
escalas, contamos con una unidad de medida con cero absoluto, es decir, que
significa ausencia del atributo o característica medida. Por ejemplo, la
longitud, podemos afirmar que un objeto que mide 10 cm. tiene el doble de
longitud que uno que mide 5 cm. Otros ejemplos: peso, duración de un suceso,
temperatura en grados Kelvin (que sí tiene cero absoluto).
No hay comentarios:
Publicar un comentario