Mapas Auto-Organizados

June 28, 2017 | Autor: W. Sánchez Sánchez | Categoria: Artificial Intelligence, Ingenieria De Sistemas, Redes Neuronales Artificiales

Share Embed

Denunciar este link

Descrição do Produto

Sánchez Sánchez Williams M.: "Mapas Auto Organizados"
MAPAS AUTOORGANIZADOS DE KOHONEN
Sánchez Sánchez Williams Manuel
[email protected]
Escuela Profesional de Ingeniería en Informática y de Sistemas
Resumen: La investigación desarrollada dará a conocer puntos clave sobre los Mapas Auto-organizados, sus características, su regla de aprendizaje, funcionalidad, con el fin de resolver y aclarar problemas de clasificación.Palabras Clave: SOM, Auto organizado, Red Neuronal.Resumen: La investigación desarrollada dará a conocer puntos clave sobre los Mapas Auto-organizados, sus características, su regla de aprendizaje, funcionalidad, con el fin de resolver y aclarar problemas de clasificación.Palabras Clave: SOM, Auto organizado, Red Neuronal.Universidad Privada San Pedro - Chimbote
Resumen: La investigación desarrollada dará a conocer puntos clave sobre los Mapas Auto-organizados, sus características, su regla de aprendizaje, funcionalidad, con el fin de resolver y aclarar problemas de clasificación.
Palabras Clave: SOM, Auto organizado, Red Neuronal.
Resumen: La investigación desarrollada dará a conocer puntos clave sobre los Mapas Auto-organizados, sus características, su regla de aprendizaje, funcionalidad, con el fin de resolver y aclarar problemas de clasificación.
Palabras Clave: SOM, Auto organizado, Red Neuronal.

Introducción: Los mapas auto-organizados o SOM (Self-Organizing Maps), también llamados redes de Kohonen son un tipo de red neuronal no supervisada, competitiva, distribuida de forma regular en una rejilla de, normalmente, dos dimensiones.
Su finalidad es descubrir la estructura subyacente de los datos introducidos en ella. A lo largo del entrenamiento de la red, los vectores de datos son introducidos en cada neurona y se comparan con el vector de peso característico de cada neurona.
La neurona que presenta menor diferencia entre su vector de peso y el vector de datos es la neurona ganadora (o BMU) y ella, y sus vecinas verán modificados sus vectores de pesos.
Este tipo de mapas permiten reducir la dimensionalidad de los vectores de entrada para representarlos mediante una matriz de distancias unificada (U-matriz) generalmente consistente en una matriz 2D, apta para la visualización como una imagen plana.

Ilustración 1 Niveles de vida de diversos países en un mapa auto-organizado.
Para entender las posibilidades de un mapa auto-organizado imaginemos por un momento que queremos comparar los niveles de vida de distintos países. Los datos estadísticos del Banco Mundial para 126 países dan 39 indicadores de calidad de vida para cada país, relacionados con salud, nutrición, educación, etc. El efecto conjunto y complejo de todos estos factores se puede visualizar en un mapa auto-organizado. Los países que tienen niveles de vida similares aparecen uno junto a otro en el mapa, y los colores sólo se han añadido para resaltar las similitudes entre países.
Los datos son del Banco Mundial son de 1992 y el ejemplo está tomado de la Universidad Tecnológica de Helsinki (http://www.cis.hut.fi/research/somresearch/worldmap.html), donde actualmente trabaja el profesor Kohonen. En este caso, datos estadísticos complejos en 39 dimensiones han sido representados usando únicamente dos dimensiones y preservando en el proceso las relaciones de proximidad entre los datos.
Estructura:
Matriz de neuronas: Las neuronas se distribuyen de forma regular en una rejilla de dos dimensiones, que pueden ser rectangulares o hexagonales, en las que cada neurona puede tener cuatro o seis vecinos respectivamente.
Espacio de entrada: Los datos de entrada corresponden a un vector de N componentes por cada atributo que queramos comprar, siendo esta dimensión la misma del vector de pesos sinápticos asociado a cada una de las neuronas de la rejilla.
Espacio de salida: Corresponde con la posición (2D) en el mapa de cada neurona.
Relación entre neuronas: Entre todas las neuronas hay una relación de vecindad que es la clave para conformar el mapa durante la etapa de entrenamiento. Esta relación viene dada por una función.

Ilustración 2 Estructura de un Mapa Auto Organizado

Aplicaciones:
Reconocimiento de patrones (especialmente, de voz).
Robótica.
Búsqueda de documentos en la Web (WEBSOM).
Compresión (imágenes).
Cuantificación vectorial y agrupamiento.
Análisis estadístico y visualización de datos multidimensionales.
Minería de datos en múltiples campos (reconocimiento de imágenes, discurso hablado, diagnóstico médico…).
"Self Organizing Maps" Help Analyze Thousands Of Genes.
Usando este algoritmo sofisticado, un equipo de científicos en el instituto de Whitehead ha diseñado una nueva técnica para analizar las cantidades masivas de datos generados por los micro arreglos de DNA. (Calderón, 2003)
Clustering:
Se pueden agrupar datos del conjunto de entrada, atendiendo a diferentes criterios. (Merelo)

Ilustración 3 Clusters

Visualización:
Este agrupamiento, como se realiza de una forma ordenada, permite visualizar al conjunto de entrada y descubrir características nuevas o relaciones que no se habían previsto de antemano. También permite visualizar la evolución temporal de un conjunto de datos: proyectando un vector en etapas sucesivas sobre un mapa entrenado se ve cómo se va moviendo de una zona con unas características determinadas a otra. (Merelo).

Ilustración 4 Visualización
Interpolación de una función:
Asignando valores numéricos a cada uno de los nodos de la red de Kohonen, se pueden asignar esos valores numéricos a los vectores de entrada: a cada vector (dato) de entrada le corresponderá el número o vector asignados a la salida más cercana. (Merelo)

Ilustración 5 Interpolación de una Función
Cuantización vectorial:
Es decir, aplicación de una entrada continua a una salida que está discretizada, obteniendo a partir de un vector cualquiera el vector más cercano de un conjunto previamente establecido. Un proceso similar se usa en la creación de la paleta de un fichero .GIF de imágenes, que necesita obtener sólo 256 colores a partir de la gama de colores original. (Merelo)

Ilustración 6 Cuantización Vectorial

Arquitectura:
Un modelo SOM está compuesto por dos capas de neuronas:
La capa de entrada (formada por N neuronas, una por cada variable de entrada) se encarga de recibir y transmitir a la capa de salida la información procedente del exterior.
La capa de salida (formada por M neuronas) es la encargada de procesar la información y formar el mapa de rasgos. Normalmente, las neuronas de la capa de salida se organizan en forma de mapa bidimensional.

Ilustración 7 Capa de Entrada y de Salida
Enfoque:
El mapa autoorganizado está formado por una matriz rectangular de neuronas, de modo que las relaciones entre los patrones de entrada son mucho más fácilmente visibles en forma de relaciones de vecindad.
Cada neurona sintoniza o aprende por sí misma a reconocer un determinado tipo de patrón de entrada.
En el espacio de salida la topología esencial del de entrada queda preservada, de manera que neuronas próximas en el mapa aprenden a reconocer patrones de entrada similares, cuyas imágenes, por lo tanto, aparecerán cercanas en el mapa creado.
Este espacio de salida se representa por una capa discreta de neuronas artificiales o procesadores elementales, generalmente ordenados formando una matriz rectangular.
En el ejemplo con el que empezábamos este apartado, los alumnos sentados en las sillas son como las neuronas alojadas en la estructura reticular.
También podemos comparar esta estructura neuronal con una hoja de cálculo. Cada neurona es una celdilla de la hoja de cálculo, que a su vez se encuentra vinculada a otras hojas. (Pensamiento-Integral-IA)

Ilustración 8 Mapa Auto Organizado
Características:
Las neuronas compiten unas con otras para llevar a cabo una tarea dada.
La competición entre neuronas se realiza en todas las capas de la red.
Tienen conexiones recurrentes de autoexcitación y de inhibición por parte de neuronas vecinas.
Este aprendizaje, categoriza (clúster) los datos introducidos en la red.
Las clases o categorías deben ser creadas por la propia red.
Estas neuronas tiene asignado un peso total, que es la suma de todos los pesos que tiene a su entrada. (Calderón, 2003)

Variables:
s es la iteración actual.
es la cantidad total de iteraciones.
t es el índice del vector de entrada en el conjunto de datos de entrada D.
D (t) es un vector de entrada de índice $t$ del conjunto de datos de entrada $D$.
v es el índice de una neurona en el mapa.
Wv es el vector de pesos de la neurona v.
µ es el índice del BMU en el mapa.
O (u, v, s) es la función de vecindad.
es un restrictor de aprendizaje debido al progreso de las iteraciones. (wikipedia)
Entrenamiento:
Para cada paso del entrenamiento (época) se introduce un vector de datos correspondiente a una entrada seleccionada aleatoriamente y se calcula la similitud entre este vector y el peso decada neurona.
La neurona más parecida al vector de entrada será la neurona ganadora (Best-Matching Unit ó BMU). Generalmente se usa la distancia euclídea para medir esta similaridad entre pesos sinápticos.
Tras esto, los vectores de pesos de la BMU y sus vecinos son actualizados de forma que se acercan al vector de entrada.

Ventajas:
Fáciles de Entender.
Funcionan muy bien para conjuntos de datos que no están demasiado esparcidos.
Reducen el requerimiento en tiempo de entrenamiento y poder de computo en relación al clustering tradicional.
Reducen la probabilidad de la parcialidad o prejuicio humano.
Poco sensible al ruido en los datos (García., 2014)
Desventajas:
Es necesario disponer de los datos adecuados.
Cada SOM es diferente y clasifica los datos de manera diferente.
No siempre los datos similares están "cerca".
Es necesario construir varios SOMs para conseguir el adecuado
La reducción de dimensiones sigue siendo computacionalmente costosa. Crece en la medida en que aumenta el radio de la vecindad (García., 2014)

Relación con la cuantificación vectorial
Las neuronas del SOM codifican prototipos de patrones de entrada ( cuantificación vectorial).
Cada prototipo tiene su región de Voronoi asociada.

Ilustración 9 Relación Cuantificación Vectorial
Función de vecindad
Determina las neuronas que pertenecen al vecindario de la neurona ganadora.
Función de vecindad gaussiana:

Ilustración 10 Función Vecindad
Ventajas e inconvenientes de SOM
Ventajas:
Relación con los métodos de cuantificación vectorial.
Visualización de la estructura de los datos (capacidad auto-explicativa): proyección bidimensional.
Inconvenientes:
Lentitud en el aprendizaje.
Pre-define la topología de la red.
Incapaz de adaptarse a las características del problema.

Conclusiones
Los mapas de Kohonen son una herramienta poderosa para encontrar patrones cuando se manejan muchas dimensiones.
Es un método que permite obtener información de un gran set de datos con un preprocesamiento mínimo.
Permite un manejo visual de la información que ayuda a un mejor entendimiento del comportamiento de las variables SOM una herramienta para el soporte de decisiones, en ningún momento presenta respuestas inmediatas, estas respuestas son dadas con ayuda de los expertos.
Su principal problema es ser computacionalmente caro.
Bibliografía
Calderón, J. L. (Febrero de 2003). slideshare. Obtenido de slideshare: http://es.slideshare.net/mentelibre/redes-neuronales-mapas-con-caractersticas-autoorganizativas-som?from_action=save
García, F. J. (s.f.). Aplicación de mapas autoorganizados(SOM) a la visualización de datos . Obtenido de Aplicación de mapas autoorganizados(SOM) a la visualización de datos : http://kile.stravaganza.org/projects/somvis/download/somvis_report.pdf
García., V. D. (Julio de 2014). Prezi. Obtenido de Prezi: https://prezi.com/wfx6oyhchadg/mapas-de-caracteristicas-auto-organizados-de-kohonen/
Goldenberg, L. D. (2007). itba. Obtenido de itba: http://www2.itba.edu.ar/archivos/secciones/goldenberg-tesisdemagister.pdf
Los mapas auto-organizados de Kohonen (SOM). (s.f.). Obtenido de Los mapas auto-organizados de Kohonen (SOM): http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/DM/tema5dm.pdf
Merelo, J. J. (s.f.). Mapa autoorganizativo de Kohonen. Obtenido de Mapa autoorganizativo de Kohonen: http://geneura.ugr.es/~jmerelo/tutoriales/bioinfo/Kohonen.html
Pensamiento-Integral-IA. (s.f.). Obtenido de Pensamiento-Integral-IA: http://pensamiento-integral-ia.wikispaces.com/MAPAS+AUTOORGANIZADOS+KOHONEN
wikipedia. (s.f.). Mapa autoorganizado. Obtenido de Mapa autoorganizado: https://es.wikipedia.org/wiki/Mapa_autoorganizado

77
7
7

Lihat lebih banyak...

Mapas Auto-Organizados

Descrição do Produto

Comentários