FASE 3 ELABORAR DOCUMENTO DE APLICACIÓN DE CONCEPTOS DE PROBABILIDAD
EDUARDO BELLO RIAÑO CÓDIGO 74 389 964 EVER DAVID MENDOZA CARO CODIGO 1049634051 JOSE CUSTODIO GUZMAN CESAR RINCON CÓDIGO: 1002587563 FRANKLIN ASDRUBAL HERRERA
LUISA FERNANDA CASAS ASESORA
ESTADISTICA DESCRIPTIVA UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD CEAD SOCHA, TUNJA 2019
Introducción El siguiente trabajo pretende dar un acercamiento general hacia los temas de la fase 3 del curso académico y del contenido temático de Estadística Descriptiva, como forma de aprehensión y comprensión de conceptos de identificación de población, muestra y variable, hallazgo de las medidas de tendencia central, análisis de datos y resultados presentes en gráficos, histogramas y polígonos de frecuencia, que permiten hallar respuesta a numerosas investigaciones con el fin de obtener datos y analizar la información presentada para su fácil acceso y manipulación, que conllevan a la correcta interpretación de estos resultados
OBJETIVO
Definir conceptos de variables aleatorias y probabilidades
Analizar distribuciones sobre probabilidad aplicada a ciencias agrarias
Aprender a aplicar modelos probabilísticos
PREGUNTAS ORIENTADORAS
E spaci spacio o muestr muestral al y con qué letr letra a se de denota. nota.
Tal conjunto de resultados posibles se denomina espacio muestral y es usualmente denotado con la letra griega omega (Ω).
P unto mue muestr stra al.
Se denomina punto muestral a cada uno de los posibles resultados de un estudio aleatorio, es decir a cada elemento de Ω
Explique en sus propias palabras el experimento
aleatorio del dado deben descargar el
CODIGODADO disponible en la siguiente columna. El estudiante debe entender que, aunque no es un experimento agropecuario nos ayuda a entender los conceptos planteados El experimento de los dados
Se ejecuta la tabla para las frecuencias absolutas, absolutas acumuladas y relativas.
Por ultimo en cuanto a las tablas se ejecuta la de frecuencias relativas acumuladas, con las conclusiones que nos da el código.
El grafico de las frecuencias relativas.
Y por último el grafico de frecuencias relativas acumuladas
Defi na Variable aleatoria
Las variables aleatorias, pueden ser interprtadas como funciones usadas para describir los resultados de un estudio aleatorio. Para el propósito del análisis de datos las clasificamos en cuantitativas y cualitativas y a las primeras en discretas y continuas dependiendo de los posibles valores que la variable pueda asumir (contable o no).
Para la definición formal de variable aleatoria, el tipo de variable es importante. El tipo de variable depende del conjunto de todos los valores que potencialmente pueden asumir en un estudio aleatorio. ¿Qué significa que el espacio muestral de una vari able aleatori a continua es no contable?
Si el espacio muestral de una variable es discreto pero representado por nombres o códigos que representan categorías excluyentes y exhaustivas de la variable, entonces la variable aleatoria es una variable cualitativa de tipo categorizada (nominal u ordinal). ¿Qué son vari ables aleatorias discretas proporcionales y que son variables aleatori as discretas de conteo no acotado?
Una variable de tipo discreta es siempre contable, es decir puede ser teóricamente enumerado, aún si éste es infinitamente grande o no está acotado. Por ejemplo, el número de nematodos por hectárea registrado a partir de una muestra aleatoria de hectáreas en producción de papas, podría no tener un valor límite. En las variables discretas, es posible contar el número de veces que un determinado valor ocurre en el espacio muestral.
Entre las variables discretas es importante distinguir al menos dos subtipos muy comunes en estudios biológicos: las proporciones que provienen de conteos que no pueden superar el número de elementos evaluados y los conteos no acotados o sin denominador natural. Ejemplo de una variable discreta expresada como proporción es el número de semillas germinadas en cajas de Petri con 25 semillas cada caja; los resultados se expresan como proporciones porque existe un denominador natural: la cantidad de semillas por caja. Ejemplo de variable discreta obtenida por un conteo (no acotado) es el número de pústulas de roya por m2 de cultivo. Para el caso de proporciones es importante dejar expresado que si bien el valor puede ser continuo en el rango 0-1, el espacio generatriz es discreto, porque la base de la variable es el conteo.
Existe dos conceptos de probabilidad el clásico y concepto frecuencial, defina cada uno, en el caso del frecuencial explique el experimento de germinación de una semilla cuál es el experimento aleatorio, cuál es el evento, cuantos puntos muestrales tiene.
El concepto de probabilidad puede definirse de distintas formas y con distintos niveles de abstracción. Las definiciones clásica, frecuencial y de Kolmogorov son las más conocidas. Cuando Ω es finito (el número de puntos muestrales es contable) se puede dar una definición de
probabilidad que se basa en la observación de los elementos del espacio muestral. Ésta se desarrolló originariamente estudiando los juegos de azar. y se conoce como el concepto o
enfoque clásico de probabilidad: Si A es un subconjunto de puntos muestrales de
, entonces la probabilidad de ocurrencia del
evento A, denotada por P(A) es: ( ) =
ú ú
Dado que el número de puntos favorables es un subconjunto del espacio muestral, se deduce que la probabilidad de un evento siempre será un número positivo, entre 0 y 1.
La definición frecuencial de probabilidad es distinta ya que se refiere a una serie repetida de estudios aleatorios. Generalmente se usa cuando el espacio muestral es infinito y por tanto no se pueden enumerar todos los resultados posibles del estudio. Así, se repite el estudio un número grande de veces y se registra la frecuencia relativa de ocurrencia de cada resultado, la que es luego usada como un estimador de probabilidad. La definición frecuencial de probabilidad establece que: Si A es un evento y nA es el número de veces que A ocurre en N repeticiones independientes del experimento, la probabilidad del evento A, denotada por P(A), se define como el límite, cuando el número de repeticiones del experimento es grande, de la frecuencia relativa asociada con el evento. ¿Qué diferencia existe entre el concepto de frecuencia relativa y el de probabilidad?
Si bien la analogía es fundamental, las frecuencias se entienden como probabilidades sólo cuando N tiende a infinito. Si el número de veces que se repite un experimento no es grande, entonces hablaremos de frecuencia relativa y diremos que ésta “aproxima” una probabilidad.
Otra idea importante para comprender la medida de probabilidad es la de eventos mutuamente
excluyentes. ¿Que son eventos mutuamente excluyentes?, como es la intersección de dos eventos mutuamente excluyentes, si son excluyentes, dado un evento A y uno B, a que es igual la P(Aꓴ B)? Se dice que dos eventos son mutuamente excluyentes si cada uno está formado por puntos muestrales distintos, es decir no existe ningún punto muestral en la intersección de los subconjuntos que representan los eventos y , por la teoría de conjuntos, se tiene: Si A y B son dos eventos de , la unión de eventos conforma un nuevo conjunto, que contiene a los puntos muestrales de A y de B. La unión de A y B se denota por A∩B.
Si A y B son dos eventos de
, la intersección de eventos conforma un nuevo conjunto, que
contiene a los puntos muestrales que simultáneamente pertenecen al subconjunto A y al subconjunto B. Denotaremos la intersección de A y B con A ∩ B.
Cuando dos eventos son excluyentes, la intersección es cero y por tanto la probabilidad de la unión de esos eventos, P(AUB), es la suma de las probabilidades de cada evento. Por el contrario, si la intersección no es vacía, la probabilidad de la unión de eventos es la suma de las probabilidades de cada evento, menos la probabilidad de la intersección. La definición de probabilidad de Kolmogorov (1937) establece que una función P(.) será considerada una medida de probabilidad si a cada evento de un espacio muestral se le asigna un número real entre 0 y 1 y, además, se cumplen tres axiomas: a) la probabilidad asociada al evento espacio muestral es igual a 1. Este resultado sugiere que si el evento de interés es todo el espacio muestral, la probabilidad de ocurrencia dado el experimento aleatorio, es 1. Existe certeza de la existencia de un resultado en el espacio muestral. b) la probabilidad de cualquier evento que sea un subconjunto del espacio muestra es mayor o igual a cero. Si entendemos a la probabilidad como el límite de una frecuencia relativa (cantidad de casos respecto de un total) es claro que las probabilidades nunca pueden ser negativas. c) Si existen dos o más eventos mutuamente excluyentes, la probabilidad de que ocurra uno u otro evento, es decir la probabilidad de la unión es igual a la suma de la probabilidad de cada uno de estos eventos.
E n el caso de distribuciones de vari ables aleatorias cuando una variable es continua y simétri ca que modelo se usa. Para una variable continua y de distribución simétrica unimodal, es común el uso del modelo Normal; mientras que para proporciones se piensa en el modelo probabilístico Binomial y para conteos no acotados en el modelo Poisson.
¿Para una variable de conteo no acotado que modelo se utiliza?
¿Qué diferencia existe entre el concepto de frecuencia relativa y el de probabilidad?
Si bien la analogía es fundamental, las frecuencias se entienden como probabilidades sólo cuando N tiende a infinito. Si el número de veces que se repite un experimento no es grande, entonces hablaremos de frecuencia relativa y diremos que ésta “aproxima” una probabilidad.
¿Qué son eventos mutuamente excluyentes?, ¿cómo es la intersección de dos eventos mutuamente excluyentes, si son excluyentes, dado un evento A y uno B, a que es igual la P(AꓴB)?
Eventos mutuamente excluyentes Se dice que dos eventos son mutuamente excluyentes si cada uno está formado por puntos muéstrales distintos, es decir no existe ningún punto muestral en la intersección de los subconjuntos que representan los eventos. Cuando dos eventos son excluyentes, la intersección es cero y por tanto la probabilidad de la unión de esos eventos, P(AB), es la suma de las probabilidades de cada evento.
En el caso de distribuciones de variables aleatorias cuando una variable es continua y simétrica que modelo se usa.
Para una variable continua y de distribución simétrica unimodal, es común el uso del modelo normal.
¿Para una variable de conteo no acotado que modelo se utiliza?
Modelo de Poisson.
¿Para variables de proporciones que modelo se utiliza?
Modelo probabilístico Binomial
Que variables tienen función de probabilidad y que variables tienen función de densidad.
La función de distribución de probabilidad de una variable aleatoria discreta y la función de densidad de una variable aleatoria continúa denotada como f(.) contienen exhaustivamente toda la información sobre la variable.
Cuáles son los parámetros más usados en estadística para estudiar y utilizar funciones de distribución de variables aleatorias. El valor esperado y la varianza son los parámetros más usados en estadística para estudiar y utilizar funciones de distribución de variables aleatorias.
¿Qué es la esperanza matemática de una variable aleatoria, como se denota? Denotada por E () o la letra griega Mu (µ), desde el punto de vista intuitivo, un promedio de los valores asumidos por la variable donde cada valor es ponderado por su probabilidad de ocurrencia.Proporciona información parcial acerca de la función de probabilidad (o densidad) ya que explica dónde está posicionada la distribución de valores sobre la recta real
Que es la varianza de una variable aleatoria, como se denota letra griega sigma al cuadrado σ2 , es una medida de dispersión, denominada desvió estándar (σ) para expresar la dispersión en
términos diferencia de cada dato respectivo de la esperanza
Conceptos capítulo tres modelos probabilísticos
DISTRIBUCION NORMAL Qué tipo de histograma se seleccionar un modelo probabilístico para una variable aleatoria continua cuando se tienen datos de esa variable histograma de frecuencias relativas Que es la estandarización, cuál es su fórmula. Permite llevar cualquier distribución normal estándar
Que es la estandarización, cuál es su fórmula.
nos permite llevar cualquier distribución normal a la distribución normal estándar. La transformación, estandarización, tiene la siguiente forma:
DISTRIBUCIÓN BINOMIAL Qué tipo de conteos se trabajan con la distribución Binomial, conteos acotados En la distribución binomial que es n y que es P. se supone que se realizan ciertos número (n) de experimentos aleatorios y en cada experimento se registra uno de dos resultados posibles, éxito o fracaso, donde el éxito tiene una cierta probabilidad, (p) de ocurrencia , conocido como ensayo Bernoulli
A que es igual la esperanza y la varianza en esta distribución.
Qué tipo de conteos se trabajan con la distribución Binomial
La distribución Binomial puede usarse para el cálculo de probabilidades de eventos provenientes de conteos acotados.
En la distribución binomial que es n y que es P.
Número (n) de experimentos aleatorios. Probabilidad (P) de ocurrencia.
A que es igual la esperanza y la varianza en esta distribución.
La E(Y) y la V(Y) cuando Y tiene distribución Binomial son:
DISTRIBUCION DE POISSON Que tipos de conteos se trabaja con la distribución de Poisson. Variables discretas, los conteos se refiere al número de veces que u evento ocurre en una unidad de tiempo o espacio, dada ( hora, kilo, planta, 2 etc. La distribución de Poisson también sirve como modelo probabilístico para variables discretas de tipo conteo. A diferencia de la Binomial, donde el conteo se realizaba sobre n experimentos independientes, en el caso de la Poisson, los conteos se refieren al número de veces que un evento ocurre en una unidad de tiempo o espacio dada (hora, kilo, m^2, m^3, planta, etc.) y por tanto los valores de la variable no están acotados.
En agronomía se usa para que tipo de conteos, les recuerdo los ácaros por ejemplo se pueden trabajar con esta distribución. La distribución de Poisson En Agronomía, la distribución Poisson suele usarse para modelar el número de insectos sobre una planta, o en un golpe de red, el número de manchas defectuosas en un mosaico, o en un metro cuadrado de piso, el número de colémbolos en 100 g de suelo, o en 1000 cm^3 de suelo o el número de coliformes en 1 ml de agua, entre otros conteos de interés
Como se denota el único parámetro ( λ) Esta distribución tiene un único parámetro, que representa la esperanza y también a la varianza, es decir que cuando Y~ Poisson(), se cumple:
Revisando el ejercicio de la tabla 3.1 del libro de Balzarini como se obtiene λ en este caso a
que es igual la media y la varianza.
En este caso es adecuado para no confundirse leer el texto indicado 2. Aplicación de conceptos EN EL CAPITULO 2 EN EL EJERCICIO APLICACIÓN Y PAGINAS SIGUIENTES
Estudie el ejercicio de velocidad del viento de la del texto y explicar por qué hay un sitio mejor para el objeto del estudio, pueden tomar pantallazos del gráfico.
Desarrolle el ejercicio 2.1 del texto de Balzarini y en el caso del punto e revise la presentación de probabilidad obtener la tabla de frecuencias relativas f(y) y la tabla de frecuencias relativas acumuladas que es la misma F(Y), este ejercicio se puede desarrollar en una tabla de Word.
Figura 2.3: Gráfico de la distribución empírica de la velocidad del viento (km/h) en dos zonas de un establecimiento agrícola, denominadas zona sur (izquierda) y zona norte (derecha). Balzarini, M. (2013), Estadística y biometría. Pag 77.
De acuerdo con el texto, y teniendo en cuenta que un molino de viento para generar electricidad comienza a funcionar cuando el viento alcanza una velocidad de unos 19 km/h, logra su máximo rendimiento con vientos entre 40 y 48 km/h y deja de funcionar cuando los vientos alcanzan los 100 km/h. y si lo que se busca es extracción de agua subterránea, se espera una velocidad del viento promedio de 26 km/h. En función de la velocidad del viento, la zona norte como aquella con mejores aptitudes para usar la energía eólica puesto que la velocidad del viento es aproximadamente de 46 km/h, esto es equivalente a decir que el 50% de las veces, el viento alcanzó una velocidad promedio de 46 km/h o menor. El 10% de las veces, la velocidad del viento superó 48 km/h. El rango de velocidades en la zona norte varió entre 37 km/h hasta 54 km/h, mientras que, en la zona sur se registraron velocidades del viento que oscilaron entre los 18 y 29 km/h. Sólo el 10% de las veces la velocidad del viento superó los 26 km/h.
Ejercicio 2.1: Supongamos que se toma una muestra aleatoria con reposición de tamaño n=2 a partir del conjunto {1,2,3} y se produce el siguiente espacio muestral con 9 puntos muéstrales: Ω= {(1,1), (1,2), (1,3), (2,1), (2,2), (2,3), (3,1), (3,2), (3,3)}
Supongamos además que definimos la variable aleatoria Y=suma de los dos números. que conforma un nuevo espacio probabilístico y que estamos interesados en los siguientes eventos: El evento A conformado por los puntos muéstrales cuya suma sea un número par, es decir: A= {(1,1), (1,3), (2,2), (3,1), (3,3)} y P(A)=5/9 El evento B conformado por los puntos muéstrales cuya suma sea número impar, siendo:
B= {(1,2), (2,1), (2,3), (3,2)} y P(B)=4/9 El evento C conformad por los elementos cuya suma es 5. Preguntas: a) ¿Qué tipo de concepto de probabilidad aplicaría para
calcular probabilidades? Para este caso aplica el concepto clásico ya que es cuando Ω es finito la
definición de probabilidad se basa en la observación de los elementos del espacio muestral. b) Los eventos A y B, ¿son independientes?
No son independientes pues A y B son subconjuntos.
c) ¿Cuál es la probabilidad de que ocurra A o B?
1, porque: 5 ( ) =
9 4 ( ) =
9 5 ( ) =
4 +
9
=1 9
d) ¿Cuál es la probabilidad de que ocurra B o C?
4/9 e) Representar tabularmente a F(Y)
Y
F(Y)
2
1/9
3
3/9
4
6/9
5
8/9
6
1
Ejercicio 2.3: Los siguientes datos corresponden a la venta de tractores que registra una empresa de maquinarias agrícolas en los días laborables del último año:
Tractores vendidos
Cantidad de días
0
110
1
80
2
35
3
25
4
10
Total
260
Preguntas: a) ¿Cuál es la variable en estudio?
X= Cantidad de tractores vendidos por día b) ¿Cuántos resultados posibles tiene la variable? ¿Qué tipo de variable es?
La variable tiene 5 posibles resultados y es de tipo discreta
c) ¿Cuál es la probabilidad que hoy no venda ningún tractor?
110 ( ) =
260 d) ¿Cuál es la probabilidad que un día, seleccionado al azar dentro de
los días laborables del año, venda 3 o más tractores? 25 ( ) = ( = 3) + ( = 4 á) =
10 +
260
260
35 = 0,1346
= 260
e) ¿Cuál es la probabilidad que en los próximos dos días venda 3 tractores?
( = 3 ñ 3 ñ) 25 =
24
× = 0,0088 260 260
En este caso el código explica como seleccionar las variables y el programa las lee del archivo PROBABILIDAD Cada estudiante debe correr el modelo para una variable discreta y una continua dando conclusiones de lo encontrado acorde a su profesión. ¿cuál es conteo de más alta probabilidad? En el caso de la variable continua el 50% de los datos de su variables serán menores ó iguales a que a valor?
Bibliografías
Balzarini, M. (2013). Estadística y biometría: ilustraciones del uso e infostat en problemas de agronomía. Recuperado de http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.action?docID=3221775&q uery=bioestadistica
Deaza D. (2018). OVI Distribuciones de probabilidad en el programa R. Recuperado de: http://hdl.handle.net/10596/23235