Competición de series temporales:
Esta competición esta organizada de forma conjunta con el V Simposio de Teoría y Aplicaciones de Minería de Datos (TAMIDA 2010). El objetivo de la competición es la predicción de dos series temporales:
1) La serie temporal esta formada por los valores horarios (24 valores por día) del ozono de los meses de junio, julio y agosto para todos los años desde el 2005 hasta el 2007 (6624 valores en total). Se trata de predecir los niveles de ozono en la atmósfera desde el 1 de junio de 2008 hasta el 31 de agosto de 2008 (24 valores por día, es decir un total de 2208 valores). Descargar
Además se proporcionan otras series temporales que influyen en el ozono como son la temperatura y otros agentes contaminantes como el dióxido de azufre y el monóxido de nitrógeno. Estas series temporales están formadas por los valores correspondientes a los meses de junio, julio y agosto para todos los años desde el 2005 hasta el 2007. Descargar
Todas las series presentan valores perdidos que estan representados por el valor -1.
2) Una serie temporal relacionada con una determinada cuenca hidrografica cuyo significado sera desvelado al final de la competición. La serie está formada por 549 valores y se trata de predecir los 30 valores siguientes. Descargar
Evaluación
El error de la predicción vendrá definido por el Error Relativo Medio (ERM) en porcentaje:
Instrucciones: Los participantes incluirán los resultados obtenidos de la predicción en el artículo que podrán enviar bien a SICO bien a TAMIDA puesto que esta sesión conjunta sera publicada en las actas de los dos simposios. Además, los participantes en la competición deben mandar por email (jherrera@atc.ugr.es) un fichero txt con sus predicciones con el mismo formato en el que se han proporcionado las series temporales, es decir, este fichero txt para la serie temporal de ozono tendrá 92 filas y 24 columnas (92 filas correspondientes a 92 días predichos y 24 columnas correspondientes a las horas del día) y los valores estarán separados por tabulador. Y para la serie temporal de significado desconocido el fichero txt estará formado por 30 valores (30 filas con un único valor por fila).