PWG - PAPERS
Diciembre de 2010

(...) Les adjunto el resumen que he realizado del artículo publicado en ESWA. Les ruego me comuniquen cuando lo publiquen en su Web.
Reciban un cordial saludo
Antonio Morales-Esteban

Reconocimiento de Patrones para Pronosticar Series Temporales Sísmicas
Pattern recognition to forecast seismic time series
Artículo originalmente publicado en Expert Systems With Applications

Autores: A. Morales-Estebana, F. Martínez-Álvarezb, A. Troncosob, J.L. Justoa, C. Rubio-Escuderoc.

a Departamento de ingeniería del terreno, Universidad de Sevilla, España.
b Departamento de lenguajes y sistemas informáticos, Universidad Pablo de Olavide, España.
c Departamento de lenguajes y sistemas informáticos, Universidad de Sevilla, España.

RESUMEN

Los terremotos llegan sin previo aviso y pueden destruir una ciudad por completo en unos segundos, causando miles de muertes y enormes pérdidas económicas. Hoy en día, se está realizando un gran esfuerzo para desarrollar técnicas que permitan predecir estos fenómenos naturales tan estocásticos con el objetivo de tomar medidas con antelación. En este texto, se utilizan técnicas de clustering (o agrupamiento) para obtener patrones que puedan modelar el comportamiento de los datos sísmicos ordenados en función del tiempo para poder predecir terremotos de magnitud media-alta.


INTRODUCCIÓN

Una serie temporal es una secuencia de valores observada a lo largo del tiempo y, por tanto, ordenada cronológicamente.
El estudio del comportamiento pasado de una variable puede ser extremadamente valioso para ayudar a predecir su comportamiento futuro. Si, dado un juego de valores pasados, no es posible predecir valores futuros con fiabilidad, la serie temporal se dice que es estocástica. Este trabajo se incluye en este contexto, ya que los fenómenos relacionados con los terremotos son aparentemente impredecibles.
Este texto analiza y predice series temporales de los terremotos mediante la aplicación de técnicas de clustering. Se utilizan las zonas sismogenéticas como fuente de datos.
El objetivo es encontrar patrones temporales y modelar el comportamiento de series temporales que conllevan la ocurrencia de terremotos de magnitud moderada-grande, que en este estudio son terremotos de magnitud mayor o igual a 4,5. Una vez que se han extraído estos patrones, se utilizan para predecir el comportamiento del sistema con tanta exactitud como sea posible.
El análisis mediante clusters es la base de muchos algoritmos de clasificación que provén modelos de sistemas. El objetivo principal de este análisis es generar agrupamiento de datos a partir bases de datos grandes con la intención de producir una representación exacta del comportamiento del sistema. De este modo, estos algoritmos se centran en la extracción de información útil para encontrar patrones en los datos.

DESCRIPCIÓN DE LOS DATOS SÍSMICOS ESPAÑOLES
La base de datos utilizada en este estudio es el catálogo del Instituto Geográfico Nacional (IGN), que calcula la localización y la magnitud de los terremotos españoles (ver Figura 1).

 

Desde 1962 el IGN calcula la magnitud de los terremotos utilizando la amplitud y el período de las ondas.
Lo primero que se hace es eliminar las réplicas y los precursores del catálogo. A continuación se determina el año de plenitud del catálogo sísmico para cada zona sismogenética, definido como el año a partir del cual todos los terremotos de magnitud mayor o igual a M han sido registrados. Se ha calculado que 1978 es el año de plenitud del catálogo sísmico.

LEY DE GUTENBERG-RICHTER
En este estudio se ha utilizado el valor de b de la ley de Gutenberg-Richter. El valor de b es un parámetro que refleja la tectónica de la zona analizada y se ha relacionado con las características físicas del área. Un valor alto del parámetro implica que predominan los terremotos de pequeña magnitud y, por tanto, la región tiene baja resistencia. Por el contrario, un valor bajo muestra que el número relativo de terremotos pequeños y grandes es similar, lo que implica una mayor resistencia del material.
El análisis de la variación del valor de b se ha utilizado a menudo en la predicción de terremotos.

RECONOCIMIENTO DE PATRONES EN DATOS SÍSMICOS TEMPORALES
En primer lugar, se construye un juego de datos de terremotos de la siguiente manera: cada terremoto se representa por tres características: la magnitud, el valor de b y la fecha de ocurrencia.
Se ha utilizado el algoritmo K-means para ordenar los datos. Este algoritmo utiliza el centroide como punto más representativo de cada cluster. El algoritmo une n objetos en K grupos e incrementa el parecido dentro del cluster al mismo tiempo. Este parecido se mide con respecto al centroide de los objetos que pertenecen al cluster (ver Figura 2).
Este estudio sólo se ha podido llevar a cabo en las zonas sismogenéticas correspondientes al Mar del Alborán y a la parte occidental de la falla Azores-Gibraltar debido a la escasez de terremotos de magnitud media-alta en el resto de zonas.
Una vez clasificados los datos mediante el algoritmo se representan en una línea temporal los clusters y los terremotos de magnitud superior a 4,5.
Como puede observarse en la Figura 3 aparece una correlación muy clara ya que, en este caso, se produjo un cluster tipo 3 con anterioridad a los terremotos de magnitud superior a 4,5. Una vez se produjo el terremoto de magnitud moderada-grande el cluster cambió a tipo 1.

CONCLUSIONES
En este texto se ha propuesto el reconocimiento de patrones temporales de para los terremotos de magnitud superior a 4,5 basándose en el algoritmo K-means. El análisis estadístico llevado a cabo en este estudio ha mostrado una sensibilidad y una especificidad del 90,00% y 82,56% para el Mar de Alborán y del 79,31% y 90,38% para la parte occidental de la falla Azores-Gibraltar.




AGRADECIMIENTOS
Agradecemos el apoyo financiero dado por el Ministerio Español de Ciencia y Tecnología, a través de los proyectos BIA2004-01 302 y TIN-68084-C02 y por la Junta de Andalucía, a través del Proyecto P07-TIC-02611.

 

Home: www.geofisica.cl