21/12/16

Notas definitivas de evaluación continua

En este enlace tenéis las notas definitivas de evaluación continua que suponen, como sabéis, el 45% de la nota final de la asignatura.

16/12/16

Tutorías en período de exámenes (diciembre de 2016)

En los días y horas que a continuación se detallan, podéis revisar la nota de evaluación continua y consultar las dudas que consideréis oportunas:
Lunes 19 de 10 a 12 y de 13 a 14.
Miércoles 21 de 10 a 11.
Viernes 23 de 11 a 13.
Martes 27 de 11 a 13.
Miércoles 28 de 11 a 13.
Jueves 29 de 11 a 13.
También me podéis mandar un email a la dirección: josemari.eguzkitza@ehu.eus.

15/12/16

Problemas EP 9-8 y EP 9-9

Os adjunto la resolución de los problemas EP 9-8 y EP 9-9 que han quedado pendientes en clase: enlace.

12/12/16

Técnicas de respuesta aleatorizada

Existen técnicas para conseguir respuestas en encuestas a preguntas delicadas que el encuestado no se atreve a responder con sinceridad. Para conocer más sobre el tema tenéis este interesante enlace.

9/12/16

Examen de laboratorio

La prueba de R se realizará con ordenador, de forma personal, de acuerdo al calendario siguiente. Se puede utilizar el libro de laboratorio de R.

- Subgrupo 1: viernes 16 de diciembre de 13 a 14.
- Subgrupo 2: lunes 19 de diciembre de 12 a 13.
- Subgrupo 3: miércoles 21 de diciembre de 9 a 10.

Repaso tema 9

Los ejercicios de repaso que, como mínimo, debéis trabajar en el tema 9 son: EP 9-2, EP 9-3, EP 9-8, EP 9-9 y EP 9-10.

Apuntes: Tema 10 - Contrastes Ji-cuadrado

Enlace. Este tema no entra en examen.

1/12/16

Apuntes: Tema 9 - Contrastes de hipótesis

Enlace.

Solución al ejercicio sobre la distribución hipergeométrica (oposiciones)

La solución al ejercicio planteado el día 1 de noviembre es la siguiente:

Sea X = nº de temas conocidos entre los 5 elegidos al azar. Entonces X ---> H(100,5,p).

Sea t el nº de temas a preparar para tener una seguridad del 80%, al menos, de que la prueba será superada. Entonces, X ---> H(100,5,t/100). Por tanto, se debe cumplir

P(X>=3)>=0.8, o lo que es lo mismo, P(X=3)+P(X=4)+P(X=5)>=0.8

Como en la sintaxis de R los argumentos son H(t,100-t,5) se deberá cumplir

dhyper(3,t,100-t,5)+dhyper(4,t,100-t,5)+dhyper(5,t,100-t,5)>=0.8

Probamos la expresión anterior (el lado izquierdo de la desigualdad) con distintos valores de t y tenemos:

Para t=80 se obtiene 0.794
Para t=81 se obtiene 0.798
Para t=82 se obtiene 0.802

Por tanto, la solución es: 82 temas

30/11/16

Calificaciones PEC del 24-11-16

Enlace.

NOTA: Hay tres exámenes en los que el alumno no escribió su nombre.

27/11/16

Práctica de ordenador 4

Aspectos más relevantes de la Práctica 4: Estimación por punto y por intervalo y Contrastes de hipótesis (capítulos 6 y 7 del texto Laboratorio de Estadística y Probabilidad con R):

- Estudio de la normalidad de los datos:
Si los datos son normales,
1) el histograma correspondiente será más o menos el de una distribución normal;
2) se ajustarán más o menos a la línea qqline en el gráfico qqnorm;
3) darán p-valores altos en el test de Shapiro y en los test de normalidad del paquete nortest

mean(): Estimador puntual de la media
var(): Estimador puntual de la varianza
t.test()$conf: Para calcular intervalos de confianza para la media en poblaciones normales
var.test()$conf: Para calcular intervalos de confianza para el cociente de varianzas en poblaciones normales
t.test(): Para realizar contrastes de hipótesis sobre la media y sobre la diferencia de medias en poblaciones normales
var.test(): Para realizar contrastes de hipótesis sobre el cociente de varianzas en poblaciones normales
prop.test(): Para realizar contrastes de hipótesis sobre proporciones
chisq.test(): Para realizar contrastes ji-cuadrado

Repaso tema 8

Los ejercicios de repaso que, como mínimo, debéis trabajar en el tema 8 son: EP 8-1, EP 8-3, EP 8-4, EP 8-6 y EP 8-7.

17/11/16

Prueba de evaluación continua

La prueba de evaluación continua, que como sabéis supone el 10% de la nota final, se celebrará en el aula habitual el jueves 24 de noviembre, de 10 a 11 y de 11 a 12.

La prueba consistirá en 3 problemas de los temas 2, 3, 4, 5 y 6.

Exámenes resueltos de cursos anteriores

En estos enlaces podéis descargar los exámenes resueltos de los tres últimos cursos:

- Enero14.
- Junio14.
- Enero15.
- Junio15.
- Enero16.
- Junio16.

14/11/16

Apuntes: Tema 8 - Estimación por punto y por intervalo

Enlace.

Repaso tema 7

Los ejercicios de repaso que, como mínimo, debéis trabajar en el tema 7, son: EP 7-1, EP 7-2, EP 7-4, EP 7-5, EP 7-9 y EP 7-10.

Un vídeo sobre el teorema central del límite

Enlace.

Interesante lección sobre el azar

Os adjunto el enlace a una interesantísima lección del profesor Sanz-Serna (a partir del minuto 6 aproximadamente) sobre la no muy buena adecuación del cerebro humano para comprender el azar.

7/11/16

Calificaciones hasta el momento (7-11-16)

Enlace.

Trabajo en equipo 3: Variables aleatorias


Se deberá hacer lo siguiente:

  • En primer lugar vamos a definir el número m para cada uno de los equipos de trabajo (los ya formados por 4, 5 o 6 alumnos): m es el resto de la división entera entre la suma de las letras de los primeros apellidos de los componentes del grupo y el divisor 4. De este modo, m será 0, 1, 2 o 3. Por ejemplo, si los apellidos son: Agirre, García, Ruiz y Zabala, que suman 22 letras, al dividir 22 por 4 el resto es 2, y m=2.
Este Trabajo en equipo consta de tres ejercicios: 
  1. Para m=0 o m=1 explicar el teorema de Chebyshev presentando un ejemplo práctico. Para m=2 explicar y dar un ejemplo de las medidas de asimetría de una variable aleatoria. Para m=3 explicar y dar un ejemplo de las medidas de apuntamiento de una variable aleatoria.   
  2. Buscar información sobre una de las distribuciones siguientes: Geométrica (esta será la que corresponde a un grupo cuyo m=0 o m=1) o Binomial negativa (esta será elegida por el grupo cuyo m=2 o m=3). Explicar sus aplicaciones prácticas. Resolver, así mismo, un ejercicio concreto en el que intervenga esa variable aleatoria.
  3. Repetir el apartado anterior para una de las distribuciones continuas siguientes: Pareto (grupo con m=0), Cauchy (grupo con m=1), Logística (grupo con m=2), Weibull (grupo con m=3).

MUY IMPORTANTE:
- Se seguirán las normas generales de los Trabajos en equipo.
- Se debe hacer uso de R en todo lo que sea posible.
- No tratar sobre cosas que no se han estudiado: función generatriz, función característica, etc.
- El trabajo debe abarcar todo lo que se pide.
- Hay que ser coherentes con la nomenclatura. Por ejemplo, si normalmente denominamos a la función de distribución F(x), en el trabajo hay que seguir haciéndolo igual.

5/11/16

Ejercicio de la ruleta

Quiero insistir, como hice en su momento en clase, en este sencillo ejercicio (ejercicio propuesto EP 4-1), porque intervienen varios conceptos importantes que hemos estudiado hasta este momento:

- Experimento aleatorio: lanzar la bolita en la ruleta y ver qué resultado se obtiene.
- Espacio muestral: formado por 3 sucesos elementales no equiprobables (0, Par, Impar), pero de los que conocemos sus probabilidades. Se podría haber definido otro espacio muestral, pero para resolver este ejercicio es más adecuado el que hemos elegido.
- Definición de la v.a. X con todo detalle: "ganancia obtenida al apostar k euros a impar en el juego de la ruleta".
- Obtención de los orígenes y de las imágenes de X.
- Obtención de la función de masa de X a partir de los valores anteriores.
- Cálculo de E(X).
- Interpretación de E(X) como el valor medio que se obtendría a la larga si se repitiera el experimento muchísimas veces.
- Cuanto mayor sea el valor k que apostemos mayor será la pérdida esperada.
...

Os recomiendo que trabajéis este sencillo ejercicio en profundidad, desmenuzándolo al máximo.

3/11/16

Guía de referencia de R

Os adjunto un archivo con un resumen de las funciones más importantes de R (se trata de una especie de chuleta), algo que resulta muy práctico para tener a mano cuando se trabaja con este programa: R-refcard.

2/11/16

Práctica de ordenador 3

Aspectos más relevantes referentes a la Práctica 3: Distribuciones de probabilidad discretas y continuas (capítulos 4 y 5 del texto Laboratorio de Estadística y Probabilidad con R):

-Funciones importantes:

Nombres en R de las principales distribuciones discretas y continuas: binom, hyper, pois, unif, exp, norm, chisq, t, f, ...
d+nombredistribución(): Función de masa o de densidad.
p+nombredistribución(): Función de distribución.
matrix(): Para generar una matriz.
windows(): Abre una ventana gráfica conservando la anterior.
add=T: Con esta opción el gráfico actual se añade al anterior.
split.screen(): Para hacer varios gráficos en uno.
locator(): Para localizar puntos en un gráfico.
text(): Inserta texto en un gráfico.

1/11/16

Ejercicio sobre la distribución hipergeométrica (oposiciones)

Tratad de resolver el ejercicio propuesto a continuación. La solución será presentada más adelante en este blog.

Una oposición consta de 100 temas, de los que se eligen al azar 5. Para superar la prueba se necesita desarrollar correctamente al menos 3 de ellos. ¿Cuántos temas habrá que preparar para tener una seguridad del 80%, como mínimo, de que la prueba será superada?

Recomendación: Como para llegar a la solución hay que ir tanteando, os recomiendo que lo hagáis con R utilizando la función phyper, sobre la que podéis obtener información en Ayuda - Funciones R (texto).

27/10/16

Adenda de Estadística y Probabilidad

Os adjunto una adenda con las principales fórmulas de la asignatura. En el examen final solo se permitirá utilizar esta adenda y la calculadora, como material auxiliar.

Tablas estadísticas con R

R es una alternativa muy interesante a las tablas estadísticas clásicas. En este enlace disponéis de una pequeña guía para aprender a manejar R en ese ámbito.

Como complemento os adjunto un documento equivalente en Excel: tablas estadísticas con Excel.

20/10/16

Repaso temas 4, 5 y 6

Los ejercicios de repaso sobre variables aleatorias que, como mínimo, debéis trabajar son los siguientes: EP 4-3, EP 4-5, EP 4-7, EP 4-8, EP 5-2, EP 5-7, EP 5-8, EP 5-9, EP 6-1, EP 6-2, EP 6-4 y EP 6-7. Estos serán los ejercicios que vosotros resolveréis en la pizarra en las clases de prácticas de aula.

Apuntes: Tema 6 - Distribuciones continuas importantes

Enlace.

Apuntes: Tema 5 - Distribuciones discretas importantes

Enlace.

14/10/16

Problema de las 3 puertas o de Monty Hall

El llamado problema de las tres puertas o de Monty Hall es un curioso problema de probabilidad en el que suele fallar la intuición. En este enlace de la página web Estadística para todos encontraréis el planteamiento y la solución del problema. Me interesa que comprendáis, especialmente, la explicación matemática, pues en ella se hace uso del teorema de la probabilidad total. Es de resaltar que, como ocurre en muchos problemas de probabilidad, para llegar a la solución hay que definir adecuadamente los sucesos; en este caso G, A y B. Estos dos últimos forman un sistema completo de sucesos.

13/10/16

Trabajo en equipo 2: Estadística Descriptiva II


  • A partir de una muestra de datos (de tamaño 50 como mínimo), referidos fundamentalmente a cuestiones de la Ciencia o de la Tecnología, se deberán elegir dos variables cuantitativas (50 pares de valores como mínimo, por tanto) para realizar un análisis descriptivo de cada una de ellas y de la posible relación existente entre ambas, utilizando R
  • En este ejercicio se deberá explicar con detalle dónde se han obtenido los datos, qué representan y cuál es el objetivo del análisis correspondiente. Evidentemente, no pueden faltar las conclusiones.
  • NO DEBÉIS UTILIZAR, en ningún caso, datos temporales; es decir, aquellos que se han obtenido de forma consecutiva en el tiempo, como por ejemplo:
Mes

Ventas en €           Cantidad
Enero 16

20.500                    234
Febrero 16

31.025                    347 
Marzo 16

27.100                    255
Abril 16

18.890                    178

…                           …

11/10/16

Datos para la Práctica de ordenador 2

Si tenéis problemas al cargar en R el paquete ISwR, en este enlace podéis obtener el marco de datos rmr.txt.

6/10/16

Práctica de ordenador 2

Aspectos más importantes referentes a la Práctica 2: Estadística descriptiva (capítulos 2 y 3 del texto Laboratorio de Estadística y Probabilidad con R):  

-Funciones importantes:

cut( ): Para situar valores en intervalos.
table( ): Genera una tabla de frecuencias.
stem( ): Diagrama de tallos y hojas.
hist( ): Histograma.
mean( ): Media.
median( ): Mediana.
var( ): Cuasivarianza; para obtener la varianza multiplicar por (n-1/n).
sd( ): Cuasidesviación típica; para obtener la desviación típica multiplicar por sqrt(n-1/n).
quantile( ): Cálculo de percentiles.
boxplot( ): Diagrama de cajas.
as.data.frame( ): Para transformar un objeto en un marco de datos.
barplot( ): Diagrama de barras.
pie( ): Diagrama de sectores.

cor( ): Coeficiente de correlación.
lm( ): Para obtener la recta de regresión (modelo lineal).
abline( ): Para generar una recta de pendiente y ordenada en el origen a.
resid( ): Calcula los residuos de la regresión.
identify( ): Para identificar puntos en un gráfico.

5/10/16

Estadística y probabilidad en informática (cont.)

Siguiendo en la línea del post sobre la utilidad de la estadística y la probabilidad en informática, quisiera que leyerais el breve artículo escrito por Josu Doncel en la revista Pikasle, editada por los estudiantes de Matemáticas de la Facultad de Ciencia y Tecnología de la UPV/EHU.

Josu Doncel fue un muy buen alumno de esta Escuela, que terminó hace unos años la titulación en Electrónica, y que, tras conseguir la licenciatura en Matemáticas, se ha doctorado después de una estancia en un instituto de investigación de Toulouse.

Las cuestiones de las que habla Josu en su articulillo -cadenas de Markov, teoría de colas, teoría de juegos...-, y que están relacionadas con las redes de telecomunicaciones, y por tanto con la informática, no son más que aplicaciones de la teoría de la probabilidad.

4/10/16

Alfabeto griego

Como sabéis, en matemáticas se usan con profusión las letras griegas, tanto minúsculas como mayúsculas. Aquí podéis descargar el alfabeto griego.

3/10/16

Estadística y probabilidad en informática

Suele ser bastante corriente que los estudiantes se cuestionen por qué determinada asignatura está incluida en su plan de estudios. Esto ocurre con frecuencia entre los alumnos de informática respecto de la asignatura de estadística. Las líneas siguientes tratan de aclarar algo la cuestión.

En primer lugar, se debe señalar que la estadística es una herramienta de manejo frecuente entre los informáticos, pues es bastante probable que en su práctica profesional tengan que tratar gran cantidad de datos (estadística descriptiva o análisis de datos, data mining, big data, ...), para posteriormente extraer consecuencias de ellos (estadística de la inferencia).

En segundo lugar, el cálculo de probabilidades -además de herramienta necesaria para abordar el estudio de la estadística- y la informática son dos campos muy relacionados entre sí. Por ejemplo, en muchos casos la elección de un algoritmo se hace en base a razones probabilísticas, pues para evaluar su rapidez se pueden introducir los datos de forma aleatoria y medir el tiempo que tarda en realizar la tarea correspondiente. Así mismo, es muy importante en simulación generar números aleatorios; en transmisión de la información el ruido que hace imposible transmitir la señal con exactitud es una variable aleatoria; algunos métodos de análisis de imágenes son probabilísticos, etc, etc.

22/9/16

Apuntes: Tema 4 - Concepto de variable aleatoria

Enlace.

Gráfico interesante

Como os he comentado en el post anterior, en general, hay que tratar de hacer gráficos estadísticos sencillos para que sean comprensibles. No obstante, en ocasiones, ciertos gráficos algo complicados resultan muy ilustrativos. Un ejemplo, muy interactivo además, es el que aparece en este enlace: en él se detallan las tareas a las que se dedican distintos grupos de personas en EEUU durante las 24 horas del día.

Malos gráficos

Los gráficos utilizados en estadística deben ser sobrios, simples y claros. Aquí tenéis tres ejemplos de malos gráficos.

21/9/16

Problema de los cumpleaños

Si queréis tener más información sobre este curioso problema podéis acceder a este enlace.

19/9/16

Repaso temas 2 y 3

En los temas 2 y 3 abordamos el estudio de la probabilidad y de la probabilidad condicionada. Los correspondientes ejercicios de repaso que, como mínimo, debéis trabajar son los siguientes ejercicios propuestos que aparecen en los apuntes: EP 2-1, EP 2-2, EP 2-3, EP 2-4, EP 2-5, EP 3-1, EP 3-2, EP 3-4, EP 3-5 y EP 3-6. Estos ejercicios los resolveréis en las clases de los jueves 13, 20 y 27 de octubre.

Repaso tema 1

Los ejercicios de repaso de este tema que, como mínimo, debéis trabajar son los siguientes ejercicios propuestos de los apuntes del tema de Estadística Descriptiva: EP 1-2, EP 1-3, EP 1-4, EP 1-5, EP 1-6, EP 1-7, EP 1-8 y EP 1-9. Seréis vosotros mismos quienes los resolveréis en la pizarra en las clases de los jueves 29 de septiembre y 6 de octubre.

15/9/16

AVISO IMPORTANTE sobre las Prácticas de ordenador

A partir de ahora sería conveniente que, cuando haya Prácticas de ordenador, llevarais el libro de R al laboratorio, pues los ejercicios que deberéis resolver por parejas serán análogos a los que aparecen resueltos en ese texto.

14/9/16

Trabajo en equipo 1: Estadística Descriptiva I

Este primer trabajo consiste en la preparación del tema de Estadística Descriptiva. Presentaréis en el laboratorio la parte teórica y los ejercicios resueltos. El día de la presentación debéis entregar al profesor un resumen por escrito del tema y las actas de las reuniones celebradas. Los apuntes correspondientes (apuntes del Tema 1) los podéis descargar en un post anterior.

Normas generales para los Trabajos en equipo


      En primer lugar, se deberán formar los grupos de trabajo, que estarán formados por 4 o 5 componentes. En cada uno de ellos deberá haber un alumno que coordine todas las actividades.

Cuando sea necesario buscar datos se puede acceder a la página web del Eustat (Instituto Vasco de Estadística), INE (Instituto Nacional de Estadística de España), Eurostat (Oficina Estadística de la Unión Europea), etc. También es posible obtener datos de experimentos realizados en los laboratorios del Centro o en ámbitos similares. En todo caso, los datos que se utilicen en los diferentes trabajos deberán estar relacionados con la Ciencia y la Tecnología.

    Para la realización de los trabajos se deberán aplicar todos los conocimientos adquiridos en las clases de teoría y problemas y en el laboratorio (utilizando R).

    Los componentes de cada grupo deberán celebrar, como mínimo, dos reuniones antes de la presentación de su trabajo en clase. La primera de ellas servirá para repartir el trabajo y la segunda para recopilar todo lo realizado y preparar la presentación. Se deberá levantar una breve acta de ambas reuniones, indicando el grado de participación de cada uno de los miembros.

   El día de presentación del trabajo, en el laboratorio, cada grupo dispondrá de unos 10 minutos para hacer la presentación (unas 10 diapositivas como máximo). Después, durante otros 10 minutos, todos los alumnos y el profesor discutirán sobre las presentaciones realizadas.

     Una copia, en papel, del trabajo completo y de las actas de las reuniones deberá entregarse al profesor el día de la exposición.

      Cualquier duda sobre esta cuestión la podéis plantear en los comentarios de este post.

12/9/16

Apuntes: Tema 2 - Concepto de Probabilidad

Enlace.

Apuntes: Tema1 - Estadística Descriptiva

Enlace.

Práctica de ordenador 1

Aspectos más importantes referentes a la Práctica 1: Primeros pasos en R (capítulo 1 del texto Laboratorio de Estadística y Probabilidad con R):

-Funciones importantes:
c( ): Creación de vectores.
read.table( ): Función para la lectura de datos que genera un marco de datos.
write.table( ): Salida de resultados.
function( ): Para generar funciones.
plot( ): Función genérica de R para dibujar gráficos.
library( ): Carga de paquetes.
ls( ): Listar objetos.
rm( ): Eliminar objetos.
history( ): Historial de entradas.
#: Inserción de un comentario.

-Acciones importantes:
Archivo --> Abrir script: Para abrir un script que se tenga almacenado.
Editar --> Ejecutar todo: Para ejecutar un script completo, abierto previamente.
Archivo --> Guardar área de trabajo: Se guardan todos los objetos generados (vectores, marcos de datos, etc.).
Archivo --> Guardar histórico: Se guardan todas las entradas.
Archivo --> Guardar en archivo: Se guarda el historial de entradas y salidas de la sesión.

↑: Se accede a la última entrada.

10/9/16

Calendario de Prácticas de ordenador

Haciendo clic aquí podéis descargar el calendario de las prácticas de ordenador y de los trabajos en equipo que se desarrollarán en el laboratorio según el calendario oficial.

PRÁCTICAS DE R

Práctica 1: Primeros pasos en R (capítulo 1 del libro de laboratorio)
Práctica 2: Estadística descriptiva (capítulos 2 y 3 del libro de laboratorio)
Práctica 3: Variables aleatorias (capítulos 4 y 5 del libro de laboratorio)
Práctica 4: Inferencia estadística (capítulos 6 y 7 del libro de laboratorio)

TRABAJOS EN EQUIPO

Trabajo en equipo 1: Estadística descriptiva I
Trabajo en equipo 2: Estadística descriptiva II
Trabajo en equipo 3: Variables aleatorias

EXAMEN DE LABORATORIO

Subgrupo 1: Semana 14
Subgrupo 2: Semana 15
Subgrupo 3: Semana 15

9/9/16

Evaluación de la asignatura

Prueba escrita final: 55%
Evaluación de resultados obtenidos en el laboratorio: 20%
Tareas (asistencia a clase, resolución de problemas, trabajos en equipo): 15%
Prueba de evaluación continua: 10%.

Programa de la asignatura

Podéis descargar aquí el programa detallado de la asignatura.

8/9/16

Presentación

Este blog ha sido creado para facilitar la comunicación entre los alumnos del grupo 01, asignatura de Métodos Estadísticos de la Ingeniería, de 2º curso del Grado en Ingeniería Informática y Sistemas de Información de la Escuela de Ingeniería de Bilbao y el profesor Jose Mari Eguzkitza.

A lo largo del curso utilizaremos este medio para comunicarnos, plantear críticas y sugerencias, introducir materiales, proponer actividades, etc. Espero que sirva como herramienta de apoyo para seguir la asignatura con mayor interés.

Un saludo a todos.