Tipos y Modos de Aprendizaje
Indice
Adaline y Perceptron

APRENDIZAJE SUPERVISADO


Dentro de este modo de Aprendizaje existen 3 tipos:

Aprendizaje por Corrección de Error

El entrenamiento consiste en presentar al sistema un conjunto de pares de datos, representado la entrada y la salida deseada para dicha entrada. Este conjunto recibe el nombre de conjunto de entrenamiento.

Objetivo:

Se trata de minimizar el Error entre la Salida Deseada y la Actual. Aprendizaje OFF Line.

Método:

  1. Inicializar aleatoriamente los pesos
  2. Presentación del conjunto de entrenamiento (CE)
  3. Obtención de las salidas para el CE
  4. Comparación de salidas deseadas con actuales.
  5. Si se verifica el criterio de finalización ir al siguiente paso, sino ir al paso 2.
  6. Fín.

Conjunto de Entrenamiento: (X,T) xi=(x1,......xn) ti=(t1,........tm) .Salida Actual: ui=(u1,.......um)

Minimizar el Error:

Aprendizaje por Refuerzo

Aprendizaje más lento que el anterior. No se dispone de un ejemplo completo del comportamiento deseado. No se conoce la salida deseada exacta para cada entrada. Se conoce como debería de ser el comportamiento de manera general ante diferentes entradas. Es un aprendizaje ON Line. Relación de entrada-salida a través de un proceso de éxito o fracaso, produciendo una señal (Señal de Refuerzo) que mide el buen funcionamiento del sistema.

Esta seña "señal de refuerzo" está caracterizada por el hecho de que es menos informativa que en el caso de aprendizaje supervisado mediante ejemplos. Barto, Sutton y Anderson han formulado el "aprendizaje por Refuerzo" como una estrategia de aprendizaje en donde no se necesita un conjunto de ejemplos evaluados por un profesor. El sistema descrito por Barto explora el espacio entrada-salida y usa una señal de refuerzo (feeback) sobre las consecuencias de la señal de control (salida de la red) sobre el entorno.

Los pesos se ajustan en base a la señal de refuerzo basándose en un mecanismo de probabilidades. "Si una acción tomada por el sistema de aprendizaje es seguida por un estado satisfactorio, entonces la tendencia del sistema a producir esa particular acción es reforzada. En otro caso, la tendencia del sistema a producir dicha acción es disminuida". La función del supervisor es más la de un crítico que la de un maestro.

Dado un Conjunto de Entrenamiento (X,R) xi=(x1,....,xn) ri*{-1,1}. Salida obtenida por la red para el patrón i: yi=(y1,....,yn).

No se trata de asociar X con R. R evalúa si la salida producida por la red es correcta o no.

Aprendizaje Estocástico

Este tipo de aprendizaje consiste básicamente en realizar cambios aleatorios en los valores de los pesos y evaluar su efecto a partir del objetivo deseado y de distribuciones de probabilidad.

Símil: Red Neuronal ------- Sólido Físico (Estados Energéticos)

Estado de mínima energía: Valores de Pesos con los que la estructura se ajusta al objetivo deseado.

Proceso:

- Boltzmann Machine. - Cauchy Machine.


M. González Penedo