jueves, 7 de enero de 2010

ESTADISTICA DESCRIPTIVA

VARIABLES Y REPRESANTACIONES
1.1.1INTRODUCCION

Es el conjunto de técnicas que se emplea para la recolección, organización, análisis e interpretación de datos.
Cuantitativos
Con valores expresados numéricamente
Cualitativos
En cuyo caso se tabulan las características de las observaciones
La estadística es comúnmente considerada como una colección de hechos numéricos expresados en términos de una relación sumisa, y que han sido recopilado a partir de otros datos numéricos.

ANTECEDENTES HISTORICOS
Desde los comienzos de la civilización ya se utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el número de personas, animales o ciertas cosas.
Hacia el año 3000 a. C. los babilonios usaban ya pequeñas tablillas de arcilla para recopilar datos en tablas sobre la producción agrícola y de los géneros vendidos o cambiados mediante trueque. Los egipcios analizaban los datos de la población y la renta del país mucho antes de construir las pirámides en el siglo XXXI a. C.
PARTES DE LA ESTADISTICA
Descriptiva
• incluye la recolección presentación y descripción de los datos muéstrales.
• Comprende las técnicas que se emplean para resumir y describir datos numéricos
Inferencia
• Comprende las técnicas con las que, con base únicamente en una muestra sometida a observación, se toman decisiones y obtención de conclusiones.

1.1.2 POBLACION Y MUESTRA

Población:
El concepto de población en estadística va más allá de lo que comúnmente se conoce como tal. Una población se precisa como un conjunto finito o infinito de personas u objetos que presentan características comunes.
"Una población es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones". Levin & Rubin (1996)."Una población es un conjunto de elementos que presentan una característica común". Cadenas (1974).
Población Finita
Este caso es posible enumerar físicamente todos los miembros del conjunto de interés. Por ejemplo, los electores registrados en PR forman una población finita. La
Junta Estatal de Elecciones puede producir una lista de todos ellos.
Población Infinita
En este caso los elementos de la población son innumerables o ilimitados. Por ejemplo, todas las personas que serán electores en PR es una población infinita.
Cuando la población es muy grande, es obvio que la observación de todos los elementos se dificulte en cuanto al trabajo, tiempo y costos necesario para hacerlo. Para solucionar este inconveniente se utiliza una muestra estadística.
Es a menudo imposible o poco práctico observar la totalidad de los individuos, sobre todos si estos son muchos. En lugar de examinar el grupo entero llamado población o universo, se examina una pequeña parte del grupo llamada muestra.
Muestra:
"Se llama muestra a una parte de la población a estudiar que sirve para representarla". Murria R. Spiegel (1991). "Una muestra es una colección de algunos elementos de la población, pero no de todos". Levin & Rubin (1996). "Una muestra debe ser definida en base de la población determinada, y las conclusiones que se obtengan de dicha muestra solo podrán referirse a la población en referencia", Cadenas (1974).
Muestreo probabilístico
Forman parte de este tipo de muestreo todos aquellos métodos para los que puede calcularse la probabilidad de extracción de cualquiera de las muestras posibles.
Este conjunto de técnicas de muestreo es el más aconsejable, aunque en ocasiones no es posible optar por él.
En este caso se habla de muestras probabilísticas, pues no es en rigor correcto hablar de muestras representativas dado que, al no conocer las características de la población, no es posible tener certeza de que tal característica se haya conseguido.

Sin reposición de los elementos: cada elemento extraído se descarta para la subsiguiente extracción. Por ejemplo, si se extrae una muestra de una "población" de bombillas para estimar la vida media de las bombillas que la integran, no será posible medir más que una vez la bombilla seleccionada.
Con reposición de los elementos: las observaciones se realizan con reemplazamiento de los individuos, de forma que la población es idéntica en todas las extracciones. En poblaciones muy grandes, la probabilidad de repetir una extracción es tan pequeña que el muestreo puede considerarse sin reposición aunque, realmente, no lo sea.
con reposición múltiple: En poblaciones muy grandes, la probabilidad de repetir una extracción es tan pequeña que el muestreo puede considerarse sin reposición. Cada elemento extraído se descarta para la subsiguiente extracción.
Para realizar este tipo de muestreo, y en determinadas situaciones, es muy útil la extracción de números aleatorios mediante ordenadores, calculadoras o tablas construidas al efecto.
Muestreo estratificado
Consiste en la división previa de la población de estudio en grupos o clases que se suponen homogéneos con respecto a alguna característica de las que se van a estudiar. A cada uno de estos estratos se le asignaría una cuota que determinaría el número de miembros del mismo que compondrán la muestra. Dentro de cada estrato se suele usar la técnica de muestreo sistemático, una de las técnicas de selección más usadas en la práctica.
Según la cantidad de elementos de la muestra que se han de elegir de cada uno de los estratos, existen dos técnicas de muestreo estratificado:
Asignación proporcional: el tamaño de la muestra dentro de cada estrato es proporcional al tamaño del estrato dentro de la población.
Asignación óptima: la muestra recogerá más individuos de aquellos estratos que tengan más variabilidad. Para ello es necesario un conocimiento previo de la población.
Por ejemplo, para un estudio de opinión, puede resultar interesante estudiar por separado las opiniones de hombres y mujeres pues se estima que, dentro de cada uno de estos grupos, puede haber cierta homogeneidad. Así, si la población está compuesta de un 55% de mujeres y un 45% de hombres, se tomaría una muestra que contenga también esos mismos porcentajes de hombres y mujeres.
Para una descripción general del muestreo estratificado y los métodos de inferencia asociados con este procedimiento, suponemos que la población está dividida en h subpoblaciones o estratos de tamaños conocidos N1, N2,...,Nh tal que las unidades en cada estrato sean homogéneas respecto a la característica en cuestión. La media y la varianza desconocidas para el i-ésimo estrato son denotadas por mi y s12, respectivamente.
Muestreo sistemático
Se utiliza cuando el universo o población es de gran tamaño, o ha de extenderse en el tiempo. Primero hay que identificar las unidades y relacionarlas con el calendario (cuando proceda). Luego hay que calcular una constante, que se denomina coeficiente de elevación K= N/n; donde N es el tamaño del universo y n el tamaño de la muestra. Determinar en qué fecha se producirá la primera extracción, para ello hay que elegir al azar un número entre 1 y K; de ahí en adelante tomar uno de cada K a intervalos regulares. Ocasionalmente, es conveniente tener en cuenta la periodicidad del fenómeno.
Esto quiere decir que si tenemos un determinado número de personas que es la población y queremos escoger de esa población un número más pequeño el cual es la muestra, dividimos el número de la población por el número de la muestra que queremos tomar y el resultado de esta operación será el intervalo, entonces escogemos un número al azar desde uno hasta el número del intervalo, y a partir de este número escogemos los demás siguiendo el orden del intervalo.
Muestreo por estadios múltiples
Esta técnica es la única opción cuando no se dispone de lista completa de la población de referencia o bien cuando por medio de la técnica de muestreo simple o estratificado se obtiene una muestra con unidades distribuidas de tal forma que resultan de difícil acceso. En el muestreo a estadios múltiples se subdivide la población en varios niveles ordenados que se extraen sucesivamente por medio de un procedimiento de embudo. El muestreo se desarrolla en varias fases o extracciones sucesivas para cada nivel.
Por ejemplo, si tenemos que construir una muestra de profesores de primaria en un país determinado, éstos pueden subdividirse en unidades primarias representadas por circunscripciones didácticas y unidades secundarias que serían los propios profesores. En primer lugar extraemos una muestra de las unidades primarias (para lo cual debemos tener la lista completa de estas unidades) y en segundo lugar extraemos aleatoriamente una muestra de unidades secundarias de cada una de las primarias seleccionadas en la primera extracción
Muestreo por conglomerados
Técnica similar al muestreo por estadios múltiples, se utiliza cuando la población se encuentra dividida, de manera natural, en grupos que se supone que contienen toda la variabilidad de la población, es decir, la representan fielmente respecto a la característica a elegir, pueden seleccionarse sólo algunos de estos grupos o conglomerados para la realización del estudio.
Dentro de los grupos seleccionados se ubicarán las unidades elementales, por ejemplo, las personas a encuestar, y podría aplicársele el instrumento de medición a todas las unidades, es decir, los miembros del grupo, o sólo se le podría aplicar a algunos de ellos, seleccionados al azar. Este método tiene la ventaja de simplificar la recogida de información muestral.
Cuando, dentro de cada conglomerado seleccionado, se extraen algunos individuos para integrar la muestra, el diseño se llama muestreo bietápico.
Las ideas de estratos y conglomerados son, en cierto sentido, opuestas. El primer método funciona mejor cuanto más homogénea es la población respecto del estrato, aunque más diferentes son éstos entre sí. En el segundo, ocurre lo contrario. Los conglomerados deben presentar toda la variabilidad, aunque deben ser muy parecidos entre sí.
Muestreo juicio
Aquél para el que no puede calcularse la probabilidad de extracción de una determinada muestra. Se busca seleccionar a individuos que se juzga de antemano tienen un conocimiento profundo del tema bajo estudio, por lo tanto, se considera que la información aportada por esas personas es vital para la toma de decisiones.

1.1.1 VARIABLES Y ESTADISTICAS

Es un símbolo que representa un elemento no especificado de un conjunto dado.
EN ESTADISTICA Características de interés sobre cada elemento individual de una población o muestra.
Según la escala de medición se divide en:
CUALITATIVAS
VARIABLES
CUANTITATIVAS
CUALITATIVAS:
Son las variables que expresan distintas cualidades, características o modalidad. Cada modalidad que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de dichos atributos.
Variable que clasifica o describe un elemento de una población.
Ordinal: La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo, leve, moderado, grave .
Nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden como por ejemplo los colores o el lugar de residencia.
CUANTITATIVA:
Son las variables que se expresan mediante cantidades numéricas.
Variable que cuantifica un elemento de una población
Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores específicos que la variable pueda asumir. Ejemplo: El número de hijos (1, 2, 3, 4, 5).
Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de valores. Por ejemplo el peso (2.3 kg, 2.4 kg, 2.5 kg...) o la altura (1.64 m, 1.65 m, 1.66 m...), que solamente está limitado por la precisión del aparato medidor, en teoría permiten que siempre exista un valor entre dos cualesquiera.
Según la influencia que asignemos a unas variables sobre otras, podrán ser:
INDEPENDIENTES
VARIABLES
DEPENDIENTES
INDEPENDIENTES:
Son las que el investigador escoge para establecer agrupaciones en el estudio, clasificando intrínsecamente a los casos del mismo. Un tipo especial son las variables de , que modifican al resto de las variables independientes y que de no tenerse en cuenta adecuadamente pueden alterar los resultados por medio de un sesgo.
DEPENDIENTES:
Son las variables de respuesta que se observan en el estudio y que podrían estar influenciadas por los valores de las variables independientes.

1.1.4 REDONDEO DE DATOS

En el redondeo de datos se toman en cuenta las cifras que se eliminan y dependiendo de su valor, se decide conservar la última cifra o aproximarla a la cantidad siguiente. La última cifra se conserva si la siguiente es menor que 5 y se incrementa si es mayor que 5; por ejemplo, si se quiere redondear a dos decimales los números 6.832 y 6.837 para el primero se tendía 6.83 (ya que es menor que 5) y para el segundo, 6.84 (ya que es mayor que 5); pero al redondear a dos cifras el numero 6.835 nos encontramos con el problema de que el 5 se encuentra a la misma distancia del 3 que del 4.
Para resolver casos como este se emplean básicamente dos criterios: redondeo al par más próximo y redondeo por exceso.
Redondeo al par más próximo, considera la aproximación de la última cifra al número par más próximo. Ejemplo al redondear a tres cifras decimales los números 4.9675 y 4.9645, se obtiene 4.968 para el primer número (ya que el 8 está más cerca) y 4.964 para el segundo (ya que el 4 está más cerca). Dicho de otras palabras, si al quitar el 5 queda un digito non (como el 7 en el primer número), éste se incrementa; si queda digito par (como el 4 en el segundo número), este se conserva.
En el segundo criterio considera que la última cifra se conserva si la siguiente es menor que 5, y se incrementa si es igual o mayor que 5; así los números del ejemplo anterior se redondearían a 4.968 y 4.965.

1.1.5 NOTACION SISTEMATIZADA
Son las diferentes formas de escribir algunas de las cantidades que implican anotaciones amplias, como son: notación logarítmica, notación del sistema de cualquier base, notación científica, notación factorial, entre otros. En estadística se maneja la notación Sigma, Factorial y Científica.
NOTACION SISTEMATIZADA “NOTACION SIGMA”
Sumatoria y notación sigma: su notación se debe al nombre de la letra griega con la cual se representa y es “å”, que indica un conjunto de números o cantidades que deben ser sumadas.
NOTACION SISTEMATIZADA “Notación Factorial”
Factorial de un numero (n): es el resultado de multiplicar su numero por todos los números enteros positivos menores que dicho numero.
Notación factorial:
“n!”
Se lee
“el factorial de n”
NOTACION SISTEMATIZADA “NOTACION CIENTIFICA”
Al multiplicar un numero por 10, siendo “n” un numero entero positivo, se corre el punto decimal tantos lugares “según n” a la derecha.
NOTACION SISTEMATIZADA “NOTACION CIENTIFICA”
NOTACION SISTEMATIZADA “NOTACION CIENTIFICA”Al resultado de una notación científica se le llama notación desarrollada.
EJEMPLOS:
Valor de “n” positivo
5
*4x10 = 4x10x10x10x10x10 = 400,000
(al no tener punto el 4, este se considera al final).
Valor de “n” negativo
-5
*4x10 = 0.00004
(al no tener punto el 4, se considera al final)

1.1.6 CIFRAS SIGNIFICATIVAS
Las cifras significativas son los dígitos de un número que consideramos no nulos.
Cualquier dígito diferente de cero es significativo.
Reglas para Cifras Significativas.
• Son significativos todos los dígitos distintos de cero.
15234 , tiene 5 cifras significativas.
• Los ceros situados entre dos cifras significativas son considerados como significativos.
890024 , tiene 6 cifras significativas
• Ceros a la izquierda del primer dígito distinto de cero no son significativos.
0.056 , tiene 2 cifras significativas.
• Si el número es mayor que (1), todos los ceros a la derecha del punto decimal son significativos.
• 400.00 , tiene 5 cifras significativas.
• 457.12 , tiene 5 cifras significativas.
• Si el número es menor que uno, entonces únicamente los ceros que están al final del número y entre los dígitos distintos de cero son significativos.
• 0.01020 , tiene 4 cifras significativas.

1.2 DISTRIBUCIONES DE FRECUENCIAS
1.2.1 TOMA DE DATOS

 Entrevista
 La entrevista es una conversación dirigida que usa un formato de preguntas y respuestas. En la entrevista se quiere obtener la opinión del entrevistado y sus sentimientos acerca del estado actual del sistema







Cuestionario
los cuestionarios pueden ser la única forma posible de relacionarse con un gran numero de personas. se puede distribuir los cuestionarios a todas las personas apropiadas para recabar hechos. no es posible observar las expresiones o relaciones de quienes responden a los cuestionarios.




Encuesta : Consiste en recopilar información sobre una parte e la población, en donde la información recopilada puede emplearse para un análisis cuantitativo con el fin de identificar las magnitudes del problema. Para realizarla es posible con:
Un cuestionario
Una Entrevista
 Observación
 Es el procedimiento empírico básico, consiste en realizar la percepción intencionada de una actividad determinada mediante la experimentación la cual consiste en la obtención de datos cuantitativos por medio de la medición del fenómeno que se este observando.

1.2.2 ORDENACION

Ordenación de datos
Es una colocación u organización de datos, de tal manera que puedas obtener los datos deseados .





















1.2.3. DISTRIBUCION DE FRECUENCIAS

Agrupacion de datos de categoria mutuamente excluyetes que indican el numero
de observaciones en cada categoria la distribucion de frecuencias presenta las
observaciones clasificadas de modo que se pueda ver el numero existente en cada
clase.

1.2.3 INTERVALO DE CLASES

 Son divisiones o categorías en las cuales se agrupan un conjunto de datos ordenados con características comunes.
 El tamaño o la amplitud de un intervalo de clase es la diferencia entre los límites superior e inferior y se le conoce como amplitud, tamaño o longitud de clase. Es igual a la diferencia entre los dos limites.
 En otras palabras, son fraccionamientos del rango o recorrido de la serie de valores para reunir los datos que presentan valores comprendidos entre dos limites.
 Para organizar los valores de la serie de datos hay que determinar un número de clases que sea conveniente
 En otras palabras, que ese número de intervalos no origine un número pequeño de clases ni muy grande. Un número de clases pequeño puede ocultar la naturaleza natural de los valores y un número muy alto puede provocar demasiados detalles como para observar alguna información de gran utilidad en la investigación.
Los intervalos de clase pueden ser de tres tipos, según el tamaño que estos presenten en una distribución de frecuencia:
 J Clases de igual tamaño
 ♫ Clases desiguales
de tamaño
 ♥ Clases abiertas.
CLASES DE = TAMAÑO
La amplitud o longitud de una clase es el número de valores o variables que concurren a una clase determinada. La amplitud de clase se designa con las letras Ic. Existen diversos criterios para determinar la amplitud de clases, ante esa diversidad de criterios, se ha considerado que lo más importante es dar un ancho o longitud de clase a todos los intervalos de tal manera que respondan a la naturaleza de los datos y al objetivo que se persigue y esto se logra con la practica.
CLASES DESIGUALES
DE TAMAÑO
El centro de la clase, es el volar de los datos que se ubica en la posición central de la clase y representa todos los demás valores de esa clase. Este valor se utiliza para el calculo de la media aritmética.
CLASES ABIERTAS
La frecuencia de clase se le denomina frecuencia absoluta y se le designa con las letras ni. Es el número total de valores de las variables que se encuentran presente en una clase determinada, de una distribución de frecuencia de clase.

1.2.5 LIMITE DE CLASES

La elaboración de una distribución de frecuencias tiene mucho de subjetivo, pero al mismo tiempo mucho de complejidad. Esto último por la determinación de los límites de las clases.
Los límites de las clases deben ser:
Mutuamente excluyente, esto es; no debe haber duda en cuanto a la
clase a que pertenece un dato determinado. Cada intervalo se llama
una clase.

















El límite inferior de la primera clase es 2400 y su respectivo límite superior es 2599, esto son los límites indicados. El dato 2480 tiene que ser incluido en esta clase y en ninguna más. Es totalmente excluyente, solo pertenece a una y solo una clase.
La anchura de una clase se llama intervalo entre clases: es la diferencia entre dos límites sucesivos inferiores de clases. En este ejemplo es 200, que resulta de efectuar la resta: 2600 — 2400.
La elección de los límites apropiados depende en gran parte de si los datos son continuos o discretos. Tomaremos solo el caso de las variables continuas solamente por ser las que presentan mayor dificultad en su confección.

1.2.6 LIMITES REALES DE CLASES

Según lo estudiado los límites de las clases deben ser mutuamente excluyente, esto es; no debe haber duda en cuanto a la clase a que pertenece un dato determinado. Cada intervalo se llama una clase.
La anchura de una clase se llama intervalo entre clases: es la diferencia entre dos límites sucesivos inferiores de clases. En este ejemplo es 200, que resulta de efectuar la resta: 2600 — 2400. La elección de los límites apropiados depende en gran parte de si los datos son continuos o discretos. Tomaremos solo el caso de las variables continuas solamente por ser las que presentan mayor dificultad en su confección.
Siguiendo con el ejemplo; se calculan los límites exactos del
intervalo: Se extienden 0.5 unidades a cada lado de los límites indicados del intervalo, es decir, el límite inferior exacto es 0.5 unidades menor que el límite inferior aparente, y el límite superior exacto es 0.5 unidades mayor que el límite superior indicado.

1.2.7 TAMAÑO DE INTERVALO DE CLASES

El tamaño o la amplitud de un intervalo de clase es la diferencia entre los límites superior e inferior y se le conoce como amplitud, tamaño o longitud de clase. Es igual a la diferencia entre los dos limites.

1.2.8 MARCA DE CLASE

La marca de clase es el punto medio de cada intervalo.
La marca de clase es el valor que representa a todo el intervalo para el cálculo de algunos parámetros.
Se representa por ci.
En un estudio estadístico, valor representativo de cada intervalo. Tomamos como marca de clase el punto medio de cada intervalo y lo calculamos sumando los extremos del intervalo y dividiéndolo entre 2.

1.2.9 HISTORAMA Y POLIGONOS DE FRECUENCIA

Histograma

Representación grafica la cual consiste en una serie de rectángulos que tienen:
a)sus bases sobre un eje horizontal (x) con centros en la marca de clase
y longitud igual al tamaño de los intervalos de clase.

b) superficies proporcionales a las frecuencias de clase.
El polígono de frecuencia:
Es una grafica poligonal en eje de ña "x" va la variable estudiada,
(Estaturas, pesos, longitud, est). En el eje de las "y" van las frecuencias.

Se da el nombre de histograma a las graficas de barras cuando representan
variables cardinales, principalmente continuas. si se unen con segmentos
de recta los puntos medios de los techos de los rectángulos, resulta un polígono.

1.2.10 DISTRIBUCION DE FRECUENCIA ACUMULADA.

Una distribución de frecuencia acumulada identifica el numero de observaciones acumulada incluidas bajo la frontera superior de cada clase de la distribución. La frecuencia acumulada para una clase puede terminarse agregando la frecuencia observada para dicha clase a la frecuencia acumulada de la clase precedente.
El grafico de una distribución de frecuencia acumulada se denomina ojiva. Para el tipo de frecuencia acumulada “menor que” este grafico indica la frecuencia acumulada debajo de cada frontera de clase de distribucion de frecuencia.
Cuando dicho grafico de linea esta suavizado, se le denomina curva ojiva.

1.2.11 DISTRIBUCION DE FRECUENCIAS RELATIVAS ACUMULADAS

Es aquella en la que el numero de observaciones relacionada con cada clase ha sido convertido en una frecuencia relativa dividiéndolo por el numero total de observaciones en la distribución total. De esta manera , cada frecuencia relativa es una proporción y puede ser convertida en un porcentaje multiplicándola por 100%.
Frecuencia relativa acumulada (Fi)
Es el cociente entre la frecuencia absoluta acumulada y el número total de datos, N. Es decir,
Con la frecuencia relativa acumulada por 100 se obtiene el porcentaje acumulado (Pi)), que al igual que Fi deberá de resultar al final el 100% de N.


Frecuencia relativa (fi)
Es el cociente entre la frecuencia absoluta y el tamaño de la muestra (N). Es decir:


Frecuencia absoluta acumulada (Ni)
Es el número de veces ni que aparece en la muestra N con un valor igual o menor al de la variable. La última frecuencia absoluta acumulada deberá ser igual a N.

1.2.12 MEDIDAS DE DIMENCION.

Una medida representa una columna que contiene datos cuantificables, normalmente numéricos, que se pueden agregar. Por lo general, una medida se asigna a una columna de una tabla de hechos.
También se puede utilizar una expresión de medida para definir el valor de una medida, en función de una columna de una tabla de hechos modificada por una Expresión multidimensional. Una expresión de medida habilita la ponderación de valores de medida; por ejemplo, se puede utilizar la conversión de moneda para ponderar una medida de ventas mediante una tasa de cambio.

1.3 PROMEDIO
1.3.1 MEDIA
La media o valor medio de una distribución de probabilidad se representa por m , y se define por:







En estas dos fórmulas f(x) es la función de probabilidad y la función densidad de probabilidad respectivamente de la variable aleatoria X en consideración.
Conviene mencionar que la media m se conoce como esperanza matemática de X o, brevemente, esperanza de X, y se representa por E(X).

1.3.2 MEDIANA

En el ámbito de la estadística, una mediana es el valor de la variable que deja el mismo número de datos antes y después que él, una vez ordenados estos. De acuerdo con esta definición el conjunto de datos menores o iguales que la mediana representarán el 50% de los datos, y los que sean mayores que la mediana representarán el otro 50% del total de datos de la muestra. La mediana coincide con el percentil 50, con el segundo cuartil y con el quinto decil.

1.3.3 MODA

La moda es el valor que tiene mayor frecuencia absoluta. En Estadística, la moda es el valor con una mayor frecuencia en una distribución de datos.
La reconocerás por que Se representa por Mo.
♫ Se puede hallar la moda para variables cualitativas y cuantitativas.
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la máxima, la distribución es bimodal o multimodal, es decir, tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9
NO LO OLVIDES
Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.
2, 2, 3, 3, 6, 6, 9, 9
Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de las dos puntuaciones adyacentes.
♥ 0, 1, 3, 3, 5, 5, 7, 8Mo = 4
Cálculo de la Moda
Por Datos Agrupados
Todos los intervalos tienen la misma amplitud.
MO = Li- 1 + fi-fi-1
(fi-fi-1) + (Fi – Fi+1)
Li-1 es el límite inferior de la clase modal.
fi es la frecuencia absoluta de la clase modal.
fi--1 es la frecuencia absoluta inmediatamente inferior a la en clase modal.
fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.
ai es la amplitud de la clase.
También se utiliza otra fórmula de la moda que da un valor aproximado de ésta:
La fórmula de la moda aproximada cuando existen distintas amplitudes es:
MO = Li- 1 + fi+1. . ai
hi-1 + hi+1

1.3.4 DECILES

Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.
Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.
D5 coincide con la mediana.
Cálculo de los deciles
En primer lugar buscamos la clase donde se encuentra en la tabla de las frecuencias acumuladas.

1.3.5 PERCENTILES

Valores de la distribución que la dividen en partes iguales, es decir, en intervalos, que comprenden el mismo número de valores.
Son 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Ejemplo, el percentil de orden 15 deja por debajo al 15% de las observaciones, y por encima queda el 85%.
En el caso de distribuciones asimétricas, la mediana y la amplitud son medidas más adecuadas. Se suelen utilizar los cuartiles y percentiles.

1.3.6 REGRESION LINEAL

En estadística la regresión lineal o ajuste lineal es un método matemático que modeliza la relación entre una variable dependiente Y, las variables independientes Xi y un término aleatorio ε. Este modelo puede ser expresado como:

Donde β0 es la intersección o término "constante", las βi son los parámetros respectivos a cada variable independiente, y p es el número de parámetros independientes a tener en cuenta en la regresión. La regresión lineal puede ser contrastada con la regresión no lineal.

1.4 MEDIDAS DE DISPERCION
1.4.1 DISPERCION

En matemáticas, dispersión significa el grado de distanciamiento de un conjunto de valores respecto a su valor medio.

1.4.2 RANGO

En estadística descriptiva se denomina rango estadístico o recorrido estadístico al intervalo de menor tamaño que contiene a los datos; es calculable mediante la resta del valor mínimo al valor máximo; por ello, comparte unidades con los datos. Permite obtener una idea de la dispersión de los datos.

1.4.3 DESVIACION DE MEDIA

La desviación media es la media de las diferencias en valor absoluto de los valores a la media.

Este valor estadístico no es de mucha utilidad en estadística debido a que no es fácil manipular dicha función al no ser derivable.
Siendo más formales, la desviación media debería llamarse desviación absoluta respecto a la media, para evitar confusiones con otra medida de dispersión, la desviación absoluta respecto a la mediana, DM, cuya fórmula es la misma, sustituyendo la media aritmética por la mediana M. Pero tal precisión no es relevante, porque la desviación absoluta respecto a la mediana es de uso todavía menos frecuente.
La desviación absoluta respecto a la media, Dm, la desviación absoluta respecto a la mediana, DM, y la desviación típica, σ, de un mismo conjunto de valores verifican la desigualdad:

Siempre ocurre que

donde el Rango es igual a
Rango = valor máximo − valor mínimo
Dm = 0 cuando los datos son exactamente iguales (e iguales a la media aritmética)
Justo sólo hay dos valores en los datos, :a,b, y hay exactamente la mitad de datos igual a :a y :b.

1.4.4 RANGO SEMINTERCUARTILICO

Existe una definición universal para el establecimiento correcto del rango lineal ni mucho menos un procedimiento sistemático bien establecido para su determinación. Su evaluación es generalmente basada en dos parámetros, calculados a partir de dos puntos experimentales disponibles para la construcción de la curva:
Rangos Intercuartilares. Es también la desviación Cautrilica. Es decir el resultado de la diferencia entre el cuartir 3 y el cuartil 1.
Se utiliza para buscar los datos más significativos de una serie de datos.

RI=Q3-Q1
Ahora el rango SEMI- intecuartil es lo mismo nada más que divido entre 2.
RsI=(Q3-Q1)/2
Pero lo básico es eso y recordar que los cuartiles se calculan así:
Para Q3= 3(#tot. Datos)/4
para Q1= 1(#tot. Datos)/4

Y ya que lo obtienes solo tienes que contar en tus datos. Ósea si tienes que Q3=5, y tuys datos son:
1,1,1,3,3,5,6,7,9,9,9,12
Eso quiere decir que el cuartil 3 cae en 3.
Para calcular medidas de ubicación (ese numerito en donde callo el 3 en el ejemplo anterior) en datos agrupados se utiliza una formula:

M.U= LRI+(a/f)c

LRI: Limite real inferior de clase
a= diferencia que hay de la frecuencia acumulada del intervalo anterior de la clase calculada con el Q
f= es la frecuencia de los datos donde se localiza Q.

1.4.5 RANGO ENTRE PERCENTILES

o Caso de una Distribución de Frecuencia de Datos Agrupados (DFDA):
o Procedimiento para calcular R p (x j ) :
o Si X j es un limite superior de algún intervalo entonces R p (x j ) = %H j
o Si X j esta contenida en el intervalo o clase p de limites l p y L p , entonces aplicamos la formula de interpolación:
Donde: C p : es el rango de la clase o intervalo p f p : es la frecuencia absoluta de la clase o intervalo p y F p-1 : es la frecuencia acumulada hasta la clase o intervalo anterior a la p.

1.4.6 VARIANZA

Una forma natural de medir la dispersión en torno a la media es calcular la media de las diferencias:

pero como habrá valores por encima y por debajo de la media que se compensarán, calcularemos mejor el cuadrado de las diferencias. Se define así varianza de una variable estadística, como la media de los cuadrados de las desviaciones de sus valores respecto a su media. Se representa por s2:

Se distingue aquí entre los casos de variable estadística y variable aleatoria. En el primer caso, tendremos una serie de valores concretos, de los que vamos a calcular su varianza, la varianza muestral. La fórmula es la que se acaba de expresar. En el caso de variable aleatoria, estaremos calculando una varianza estimada, ya que no estamos tomando muestras de un conjunto de datos inmenso y por lo tanto la media y varianza son estimadas, no conocidas. La expresión que la define cambia en un pequeño detalle: en vez de dividir el resultado de la suma entre (n-1), se divide entre (n), así:

1.4.7 DESVIACION TIPICA

La desviación estándar o desviación típica (σ) es una medida de centralización o dispersión para variables de razón (ratio o cociente) y de intervalo, de gran utilidad en la estadística descriptiva.
Se define como la raíz cuadrada de la varianza. Junto con este valor, la desviación típica es una medida (cuadrática) que informa de la media de distancias que tienen los datos respecto de su media aritmética, expresada en las mismas unidades que la variable.
Si atendemos a la colección completa de datos (la población en su totalidad) obtenemos la varianza poblacional; y si por el contrario prestamos atención sólo a una muestra de la población, obtenemos en su lugar la varianza muestral. Las expresiones de estas medidas son las que aparecen a continuación.
Expresión de la varianza muestral:

Expresión de la varianza poblacional:

Expresión de la desviación estándar poblacional:

UNIDAD 2 PROBABILIDAD
2.1 INTRODUCCION
2.1.1 ANTECEDENTES
Rama de las matemáticas que se ocupa de medir o determinar cuantitativamente la posibilidad de que ocurra un determinado proceso. La probabilidad esta basada en el estudio de la combinatoria y es un fundamento necesario de la estadística.
La creación se atribuye a los matemáticos franceses del siglo XVII Blaise Pascal y Pierre de Fermat, aunque algunos matemáticos anteriores, como Gerolamo Cardano en el siglo XV, habían aportado grandes contribuciones a su desarrollo.
La probabilidad matemática comenzó como un intento de resolver a varias preguntas que surgían en ,os juegos de azar, por ejemplo, saber cuantos dados hay que lanzar para que la probabilidad de que salga algún seis supere el 50%.
origen
La probabilidad nació gracias a los juegos de azar. En el renacimiento empiezan a surgir inquietudes en torno a contabilizar el numero de posibles resultados de un dado lanzado varias veces. A los matemáticos del siglo XVI como Pacili, Cardano y Tartaglia se deben a las primeras consideraciones sobre los juegos de azar.
En 154 Antonie Gombaud, un jugador compulsivo, pidió a Pascal que le resolviese un problema de reparto de apuestas cuando se suspendía la partida antes de terminar. La solución consistió en darse cuenta de que el reparto de las apuestas debe hacerse en función de la probabilidad de ganar que tuviese cada jugador en el momento de interrumpirse el juego. Había nacido la probabilidad.
El primero en dar una solución de probabilidad fue J. Bernoulli en 1713, reformulada por Abraham De Mavre:
“UNA FRACCION EL LA QUE EL NUMERADOR ES IGUAL A NUMERO DE APARIOCIONES DEL SUCESO O NO PUEDA OCURRIR. TAL FRACCION EXPRESA LA PROBABILIDAD DE QUE OCURRA EL SUCESO”.

2.1.2 CONCEPTOS BASICOS

 Evento: es un resultado particular de un experimento aleatorio. En términos de conjuntos, un evento es un subconjunto del espacio muestra.
 Evento Nulo: Es aquél que no tiene elementos. Se representa por f.
 Experimento: es una observación de un fenómeno que ocurre en la naturaleza.
 Experimento aleatorio: conjunto de pruebas cuyos resultados están determinados únicamente por el azar.
 Experimentos Determinísticos: Son aquellos en donde no hay incertidumbre acerca del resultado que ocurrirá cuando éstos son repetidos varias veces.
 Espacio maestral: conjunto de todos los resultados posibles de un experimento aleatorio.
 Punto maestral o suceso elemental: el resultado de una sola prueba de un experimento maestral
 Sucesos mutuamente excluyentes: sucesos o eventos que no pueden ocurrir simultáneamente .
 Sucesos complementarios: dos sucesos o eventos mutuamente excluyentes cuya unión es el espacio muestra.
 Sucesos independientes: sucesos o eventos que no tienen relación entre sí; la ocurrencia de uno no afecta la ocurrencia del otro
 Sucesos dependientes: sucesos o eventos que sí tienen relación entre sí; la ocurrencia de uno sí afecta la ocurrencia del otro.
 Combinaciones: Una combinación es una selección de objetos donde el orden en que estos han sido escogidos no interesa.

2.1.3 MODELOS MATEMATICOS

El significado de Modelo matemático en matemática fundamental, sin embargo, es algo diferente. En concreto en matemáticas se trabajan con modelos formales. Un modelo formal para una cierta teoría matemática es un conjunto sobre el que se han definido un conjunto de relaciones unarias, binarias y trinarias, que satisface las proposiciones derivadas del conjunto de axiomas de la teoría. La rama de la matemática que se encarga de estudiar sistemáticamente las propiedades de los modelos es la teoría de modelos.

2.2 ANALISIS DE FUNCIONES Y RAPIDES DE CAMBIO
2.2.1 SELECCIONES SUSECIVAS

Consideremos el típico proceso de azar del revoleo de una moneda al aire. Esta puede caer del lado que sea nosotros no podemos decir con seguridad que cara va a caer como puede caer cara o cruz en el cual se pueden repetir las mismas caras cada que se lance la moneda.
2.2.2 DIAGRAMA DE ARBOL
En los problemas de probabilidad resulta interesante y práctico organizar la información en una tabla de contingencia o en un diagrama de árbol.
Las tablas de contingencia y los diagramas de árbol están íntimamente relacionados, dado uno de ellos podemos construir el otro.
A veces, los datos del problema permiten construir fácilmente uno de ellos y a partir de él podemos construir el otro, que nos ayudará en la resolución del problema
Para la construcción de un diagrama en árbol se partirá poniendo una rama para cada una de
las posibilidades, acompañada de su probabilidad.
En el final de cada rama parcial se constituye a su vez, un nudo del cual parten nuevas ramas, según las posibilidades del siguiente paso, salvo si el nudo representa un posible final del experimento (nudo final).


2.2.3 PROCESO DE CONTAR



Contar es un proceso de abstracción que nos lleva a otorgar un número cardinal como representativo de un conjunto. Gelman y Gal listel fueron los primeros en enunciar en 1978 los cinco principios que, a modo de estadios, ha de ir descubriendo y asimilando el niño hasta que aprende a contar correctamente.

2.2.4 SUBCONJUNTO


Sean A y B dos conjuntos tal que todo elemento de A es también elemento de B, entonces decimos que:
 A es un subconjunto de B;
 B es un Super conjunto de A;
 Todo conjunto A es un subconjunto de sí mismo. Cualquier subconjunto de A que no sea igual a A se denomina propio (cuando puede ser igual a A se denomina impropio). Si A es un subconjunto propio de B, escribimos:

 De manera análoga si B es un superconjunto propio de A, escribimos:
 El conjunto vacío, denotado como:
 es un subconjunto de cualquier conjunto. Además el conjunto vacío es siempre un subconjunto propio, excepto de sí mismo.















2.2.5 COMBINACIONES

Es una selección de r objetos de n dados sin atender a la ordenación de los mismos.
Es decir, es la obtención de subcojuntos, de r elementos cada uno, a partir de un conjunto inicial de n elementos. La denotaremos con Cnr, nCr ó .




 Por ejemplo: Si tomamos el mismo conjunto A={a,b,c,d}, ¿cuántos subconjuntos de 2 elementos cada uno se pueden obtener?
 Haciéndolos se obtienen: {a,b}, {a,c}, {a,d}, {b,c}, {b,d}, {c,d}. Son seis los subconjuntos.
En general, si de n objetos dados se hacen combinaciones de r objetos cada una, el número de combinaciones obtenidas son:
 Cnr = nCr =
 o, que es lo mismo,
 Cnr = nCr =



En Excel la función COMBINAT(n,r) calcula las combinaciones de n objetos tomando r de ellos.

2.2.6 TEOREMA DE BINOMIO

 En matemáticas, el teorema del binomio es un resultado que proporciona el desarrollo de la potencia de una suma. Este teorema establece:
 El coeficiente de xkyn − k en el desarrollo de (x + y)n es



 Donde recibe el nombre de coeficiente binomial y representa el número de formas de escoger k elementos a partir de un conjunto con n elementos.

Usualmente el teorema del binomio se expresa en la siguiente variante:


Usando la fórmula para calcular el valor de (que también es representado ocasionalmente como C(n,k) ó ) se obtiene una tercera representación:



Para obtener la expansión de las potencias de una resta, basta con tomar -y en lugar de y en el caso anterior. La expresión (2) queda de la siguiente forma:

Isaac Newton generalizó la fórmula para tomar otros exponentes, considerando una serie infinita:

 Donde r puede ser cualquier número complejo (en particular, r puede ser cualquier número real, no necesariamente positivo ni entero), y los coeficientes están dados por:



 (el k = 0 es un producto vacío y por lo tanto, igual a 1; en el caso de k = 1 es igual a r, ya que los otros factores (r − 1), etc., no aparecen en ese caso).
Una forma útil pero no obvia para la potencia recíproca:




La suma en (3) converge y la igualdad es verdadera siempre que los números reales o complejos x e y sean suficientemente cercanos, en el sentido de que el valor absoluto x/y sea menor a uno.


2.3 PROBABILIDAD AXIOMATICA
2.3.1 EVENTOS COMPLEMENTARIOS

 En probabilidad es común hablar de que un evento ocurra o que no ocurra.
 Los eventos o sucesos complementarios son aquellos que si no se da uno, obligatoriamente se tiene que dar el otro
Así que tenemos:
Probabilidad de que un evento no ocurra
La probabilidad de que un evento no ocurra P(no-E), se obtiene efectuando la resta de 1 menos la probabilidad de que ocurra el evento P(E)
También se le llama COMPLEMENTO DE UN EVENTO
P(no-E) = 1- P(E)

2.3.2 PROBABILIDAD DE LA UNION DE EVENTOS

En este caso se esta pidiendo la probabilidad de que dos elementos sucedan a la vez, o la suma de ambos eventos.
Sean a y b dos eventos cualquiera de un experimento aleatorio y p (b) su probabilidad respectiva entonces:
p(aub)= p(a) + p(b) + p(aub)

2.4 PROBABILIDAD PARA LA UNIO DE EVENTOS
2.4.1 PROBABILIDAD CONDICIONAL

Probabilidad condicional es la probabilidad de que ocurra un evento A, sabiendo que también sucede otro evento B. La probabilidad condicional se escribe P(AB), y se lee «la probabilidad de A dado B.
No tiene por qué haber una relación causal o temporal entre A y B. A puede preceder en el tiempo a B, sucederlo o pueden ocurrir simultáneamente. A puede causar B, viceversa o pueden no tener relación causal. Las relaciones causales o temporales son nociones que no pertenecen al ámbito de la probabilidad. Pueden desempeñar un papel o no dependiendo de la interpretación que se le dé a los eventos.
Expresiones
Dado un espacio de probabilidad (Ω,F,P) y dos eventos (o sucesos) con P(B) > 0, la probabilidad condicional de A dado B esta definida como:

Interpretación

se puede interpretar como, tomando los mundos en los que B se cumple, la fracción en los que también se cumple A. Si el evento B es, por ejemplo, tener la gripe, y el evento A es tener dolor de cabeza, sería la probabilidad de tener dolor de cabeza cuando se está enfermo de gripe.
Gráficamente, si se interpreta el espacio de la ilustración como el espacio de todos los mundos posibles, A serían los mundos en los que se tiene dolor de cabeza y B el espacio en el que se tiene gripe. La zona verde de la intersección representaría los mundos en los que se tiene gripe y dolor de cabeza . En este caso , es decir, la probabilidad de que alguien tenga dolor de cabeza sabiendo que tiene gripe, sería la proporción de mundos con gripe y dolor de cabeza (color verde) de todos los mundos con gripe: El área verde dividida por el área de B. Como el área verde representa y el área de B representa a P(B), formalmente se tiene que:




2.4.2 EVENTOS INDEPENDIENTES

Dos o más eventos son independientes cuando la ocurrencia o no-ocurrencia de un evento no tiene efecto sobre la probabilidad de ocurrencia del otro evento (o eventos). Un caso típico de eventos independiente es el muestreo con reposición, es decir, una vez tomada la muestra se regresa de nuevo a la población donde se obtuvo. Ejemplo:
lanzar al aire dos veces una moneda son eventos independientes por que el resultado del primer evento no afecta sobre las probabilidades efectivas de que ocurra cara o sello, en el segundo lanzamiento.

2.4.3 TEOREMA DE BAYES

El teorema de Bayes, enunciado por Thomas Bayes, en la teoría de la probabilidades es el resultado que da la distribución de probabilidad condicional de un evento aleatorio A dado B en términos de la distribución de probabilidad condicional del evento B dado A y la distribución de probabilidad marginal de sólo A.
Sea {A1,A2,...,Ai,...,An} un conjunto de sucesos mutuamente excluyentes y exhaustivos, y tales que la probabilidad de cada uno de ellos es distinta de cero. Sea B un suceso cualquiera del que se conocen las probabilidades condicionales P(B Ai). Entonces, la probabilidad P(Ai B) viene dada por la expresión:


donde:
P(Ai) son las probabilidades a priori.
P(B Ai) es la probabilidad de B en la hipótesis Ai.
P(Ai B) son las probabilidades a posteriori.


2.4.4 SELECCIONES AL AZAR

 La ‘seleccion al azar’ es un concepto, no un tipo de ejercicio:
 En probabilidad, cierto suceso tiene cierta probabilidad de ocurrir, por ejemplo Se tienen 3 pelotas, una roja, y dos azules en una bolsa. Cuando dices ‘se toma una al azar’ es eso, tomar una sin alterar el resultado.
 Textualmente decimos ‘se toma una al azar’, pero en la totalidad de la expresion, tomar al azar significaria ‘elegir un caso, tal que sea afectado por todas las condiciones de probabilidad de dicho fenomeno’ o lo que es lo mismo, que si existia 33% de probabilidad de sacar la roja, que al tomar una al ‘azar’ ese resultado no se vea afectado, sino que tenga un 33% de probabilidad de ser roja.

2 comentarios:

  1. vr football videos for free at Vr. YouTube
    Vr football videos for free at Vr. YouTube. Vr sports videos for free at 유튜브 Vr. YouTube. Vr video games for free at Vr. youtube. vr football.

    ResponderEliminar
  2. Betway Archives - DRMCD
    › blog › 의왕 출장마사지 betway-a › blog › betway-a Sep 29, 구미 출장안마 2020 — Sep 29, 2020 밀양 출장안마 Betway and William Hill are one of the best bookies in online gambling 과천 출장안마 William Hill Betway Promo Code 성남 출장안마 Sports Betting Offers.

    ResponderEliminar