Los diferentes tipos de machine learning han cambiado la forma de ver el mundo, logrando que las máquinas aprendan a dominar tareas complejas y predecir con exactitud diversos hechos.
El machine learning, también conocido como aprendizaje automático, forma parte del área de la inteligencia artificial. Este tipo de tecnología se caracteriza porque permite que las máquinas puedan aprender por sí mismas y realizar diferentes funciones, sin necesidad de haber sido programadas para ello.
Esta cualidad se produce gracias a una serie de tipos de algoritmos de machine learning que permite que las computadoras puedan identificar patrones en el Big Data y realizar predicciones en segundos.
Todos los días podemos ser testigos del funcionamiento y los usos del machine learning. Por ejemplo, cuando te aparecen recomendaciones de videos o películas por Internet. También cuando estás navegando en la web y te aparece información de diferentes productos que venden en plataformas de ecommerce. Todo esto es gracias al machine learning.
Si no tienes en claro qué es el machine learning y cómo puede usarse en beneficio de la sociedad, en este blog post te explicaremos los tipos de aprendizaje en machine learning en base al algoritmo que utilizan. De acuerdo al portal Vissonar, podemos distinguir tres principales categorías de machine learning: aprendizaje supervisado, no supervisado y reforzado.
Dicho esto, veamos a profundidad cada uno de los tipos de modelo de machine learning, sus ventajas y desventajas, y cómo impactan en el día a día.
1. Aprendizaje supervisado
El aprendizaje supervisado se caracteriza porque utiliza algoritmos que tienen un aprendizaje previo basado en etiquetas que el ser humano configura con anterioridad, de manera que la máquina pueda realizar una serie de asociaciones para hacer predicciones y tomar decisiones.
Es uno de los tipos de machine learning más comunes. Algunos ejemplos de aprendizaje supervisado en machine learning se pueden ver en la detección de correos spam, en la función de reconocimiento de voz o escritura en un celular y también en el reconocimiento de firmas.
Como menciona Héctor Ariel Aragón, Senior Manager of Data Science & AI en PepsiCo y profesor del curso online de Machine Learning: aprendizaje supervisado, “en el aprendizaje supervisado vemos aplicaciones de redes neuronales, y de aquí en los últimos años hay una gran cantidad de aplicaciones en detección de objetos, en imágenes, en reconocimiento de video, texto y sonidos”.
Bien, los tipos de aprendizaje supervisado incluye la regresión y clasificación. ¡Veamos a detalle cada uno de ellos!
Regresión
Los algoritmos del aprendizaje supervisado realizan predicciones basándose en entradas de información pasada. Los tipos de algoritmos de regresión son:
-
Regresión lineal
-
Regresión polinomeal
-
Vectores de soporte - regresión
-
Árboles de decisión - regresión
-
Bosques aleatorios - regresión
Algunos ejemplos de la regresión en el aprendizaje supervisado se pueden observar en la predicción de precios, en la predicción de cantidades de compra y la predicción de ingresos de una campaña de marketing digital.
Fuente: Canva
Clasificación
La clasificación en el aprendizaje supervisado se da cuando los algoritmos realizan una clasificación de los datos, escogiendo entre dos o más categorías, a partir del análisis de la información adquirida con anterioridad. Los tipos de algoritmos de clasificación son:
-
Regresión logística
-
Vecinos más cercanos
-
Máquinas de vectores de soportes
-
Árboles de decisión - clasificación
-
Bosques aleatorios - clasificación
Algunas predicciones con el algoritmo de clasificación en el aprendizaje autónomo son, por ejemplo, cuando la plataforma predice si un cliente va a cancelar su tarjeta de crédito o cuando el sistema predice si un alumno va a obtener el puntaje necesario para pasar la clase.
Fuente: Canva
Ventajas y desventajas del aprendizaje supervisado
Ventajas del aprendizaje supervisado
-
Dado que el aprendizaje supervisado funciona con el conjunto de datos etiquetado, puedes tener una idea exacta sobre las clases de objetos.
-
Sus algoritmos son útiles para predecir la salida sobre la base de la experiencia previa.
Desventajas del aprendizaje supervisado
-
Sus algoritmos no son capaces de resolver tareas complejas.
-
Puede predecir la salida incorrecta si los datos de prueba son diferentes de los datos de entrenamiento.
-
Requiere mucho tiempo computacional para entrenar el algoritmo.
2. Aprendizaje no supervisado
Otro de los tipos de machine learning usados con frecuencia es el aprendizaje no supervisado. Aquí se utilizan algoritmos que predicen patrones sin la necesidad de recurrir a datos estructurados.
A diferencia de otros tipos de machine learning, los algoritmos que corresponden al aprendizaje no supervisado tienen la capacidad de realizar tareas de procesamiento mucho más complejas. El sistema recibe una serie de atributos de un objeto y se encarga de identificar y organizar la información.
Según el portal Aprendeia, existen dos tipos de aprendizaje no supervisado: el agrupamiento y la asociación.
Agrupamiento
El agrupamiento dentro del aprendizaje no supervisado consiste en la identificación de patrones o estructuras, dentro de una gran base de datos que no han sido clasificados.
Esta técnica del aprendizaje no supervisado se usa cuando quieres encontrar los grupos inherentes a los datos. Es una forma de agrupar los objetos en un grupo de modo que los objetos con más similitudes permanezcan en un grupo que tengan menos o ninguna similitud con los objetos de otros grupos. Un ejemplo del algoritmo de agrupamiento es juntar a los clientes por su comportamiento de compra.
Algoritmos de agrupamiento populares
-
Algoritmo de agrupamiento de K-Means
-
Algoritmo de desplazamiento medio
-
Algoritmo DBSCAN
-
Análisis de componentes principales
-
Análisis de componentes independientes
Tipos de agrupamiento
-
Exclusivo
-
Aglomerativo
-
Solapamiento
-
Probabilístico
Fuente: Canva
Asociación
Este tipo de aprendizaje no supervisado se caracteriza porque elabora asociaciones entre la información que existe dentro de la base de datos. El objetivo principal de este algoritmo de aprendizaje no supervisado es encontrar la dependencia de un elemento de datos en otro elemento de datos y mapear estas variables en consecuencia para que pueda generar el máximo beneficio.
Este algoritmo se aplica principalmente en el análisis de Market Basket, minería de uso web, producción continua, etc. Por ejemplo, cuando una persona adquiere una casa nueva, se asocia con la necesidad de comprar muebles para decorarla. Algunos algoritmos populares de aprendizaje de reglas de asociación son:
-
Algoritmo Apriori
-
Algoritmo Eclat
-
Algoritmo de crecimiento FP
Fuente: Canva
Ventajas y desventajas del aprendizaje no supervisado
Ventajas del aprendizaje no supervisado
-
Estos tipos de machine learning se pueden usar para tareas complicadas en comparación con el aprendizaje supervisado, ya que sus algoritmos funcionan en el conjunto de datos sin etiquetar.
-
Los algoritmos no supervisados son preferibles para varias tareas, ya que obtener el conjunto de datos sin etiquetar es más fácil en comparación con el conjunto de datos etiquetado.
Desventajas del aprendizaje no supervisado
-
La salida de un algoritmo no supervisado puede ser menos precisa, ya que el conjunto de datos no está etiquetado y los algoritmos no se entrenan con la salida exacta anteriormente.
-
Trabajar con el aprendizaje no supervisado es más difícil, ya que funciona con el conjunto de datos sin etiquetar que no corresponde con la salida.
3. Aprendizaje por refuerzo
A diferencia de los otros tipos de machine learning, el aprendizaje por refuerzo es considerado como uno de los más ambiciosos. Se caracteriza porque se basa en la teoría de premios y castigos para poder tomar una decisión entre las múltiples variables existentes.
A través del ensayo y error, el algoritmo de este tipo de machine learning se encarga de determinar cuáles son las decisiones que debes tomar en determinados escenarios para lograr resultados positivos. Es algo similar a la teoría del aprendizaje por ensayo y error de Thorndike.
Algunos de los usos del aprendizaje por refuerzo en el machine learning se pueden apreciar en el área de los videojuegos con el software AlphaStar, que fue desarrollado por la compañía de inteligencia artificial DeepMind y alcanzó un gran reconocimiento por derrotar a muchos gamers experimentados en el juego StarCraft II, esto gracias a que tenía la capacidad de aprender diferentes estrategias del videojuego con la práctica.
En el área de la robótica también se utiliza este tipo de machine learning. Gracias a este algoritmo, el robot puede regular sus movimientos, agarrar objetos y recorrer grandes distancias.
Elementos del aprendizaje por refuerzo
De acuerdo al portal Aprender Machine Learning, el aprendizaje por refuerzo, también conocido como reinforcement learning, tienes dos componentes:
-
Agente: se refiere al prototipo que se desea instruir para que pueda tomar decisiones con cierto grado de independencia.
-
Ambiente: es el entorno en el cual el agente se desplaza e interactúa.
Entre el agente y el ambiente se desarrolla una serie de asociaciones para llevar a cabo el aprendizaje por refuerzo en el machine learning. Estas relaciones son:
-
Acción: se refiere a las diferentes acciones posibles que un agente puede realizar.
-
Estado del ambiente: es el indicador que le brinda al agente la información sobre cómo están organizados los diferentes elementos del ambiente en ese determinado momento.
-
Recompensas o castigos: luego de que el agente toma una decisión, recibe una recompensa o castigo como consecuencia de ello. Esto servirá para aumentar o disminuir las probabilidades de que dicha acción pueda repetirse con mayor frecuencia.
Categorías del aprendizaje por refuerzo
Aprendizaje por refuerzo positivo
El aprendizaje por refuerzo positivo especifica el aumento de la tendencia del comportamiento requerido. Potencia la fuerza del comportamiento del agente y lo impacta positivamente.
Aprendizaje por refuerzo negativo
El aprendizaje por refuerzo negativo funciona exactamente de manera opuesta al aprendizaje por refuerzo positivo. Aumenta la tendencia del comportamiento específico al evitar la condición negativa.
Ventajas y desventajas del aprendizaje por refuerzo
Ventajas del aprendizaje por refuerzo
-
Ayuda a resolver problemas complejos del mundo real que son difíciles de resolver con técnicas generales.
-
El modelo de aprendizaje por refuerzo en el machine learning es similar al aprendizaje de los seres humanos; por lo tanto, se pueden encontrar los resultados más precisos.
-
Permite lograr resultados a largo plazo.
Desventajas del aprendizaje por refuerzo
-
Los algoritmos del aprendizaje por refuerzo no son los preferidos para problemas simples.
-
Los algoritmos del aprendizaje por refuerzo requieren grandes cantidades de datos y cálculos.
-
Demasiado aprendizaje por refuerzo puede conducir a una sobrecarga de estados que puede debilitar los resultados.
-
La dimensionalidad limita el aprendizaje por refuerzo para los sistemas físicos reales.
Fuente: Canva
4. Aprendizaje semisupervisado
El aprendizaje semisupervisado se encuentra entre los tipos de aprendizaje en machine learning supervisado y no supervisado. Básicamente, representa el terreno intermedio entre los algoritmos de aprendizaje supervisado (con datos de entrenamiento etiquetados) y el aprendizaje no supervisado (sin datos de entrenamiento etiquetados) que utiliza la combinación de conjuntos de datos etiquetados y no etiquetados durante el periodo de entrenamiento.
Aunque la definición de aprendizaje semisupervisado es operar con los datos que consisten en unas pocas etiquetas, en su mayoría trabaja con datos sin etiquetar. Como las etiquetas son costosas, pero para fines corporativos, pueden tener pocas etiquetas. Es completamente diferente del aprendizaje supervisado y no supervisado, ya que se basa en la presencia y ausencia de etiquetas.
Objetivo del aprendizaje semisupervisado
Para superar los inconvenientes del aprendizaje supervisado y los algoritmos de aprendizaje no supervisado, se introduce el concepto de aprendizaje semisupervisado. El objetivo principal del aprendizaje semisupervisado es utilizar de manera efectiva todos los datos disponibles, en lugar de solo datos etiquetados como en el aprendizaje supervisado.
Inicialmente, los datos similares se agrupan junto con un algoritmo de aprendizaje no supervisado que ayuda a agrupar los datos no etiquetados en datos etiquetados. Como te mencionamos antes, esto se debe a que los datos etiquetados son una adquisición comparativamente más costosa que los datos no etiquetados.
Imagina estos algoritmos con el siguiente ejemplo: el aprendizaje supervisado es semejante a cuando un estudiante está bajo la supervisión de un instructor en el hogar y la universidad. Pero si este estudiante está autoanalizando el mismo concepto sin la ayuda del instructor, se trata de un aprendizaje no supervisado.
En cambio, bajo el aprendizaje semisupervisado, el estudiante tiene que revisarse a sí mismo después de analizar el mismo concepto bajo la guía de un instructor en la universidad.
Ventajas y desventajas del aprendizaje semisupervisado
Ventajas del aprendizaje semisupervisado
-
Su algoritmo es simple y fácil de entender.
-
Es altamente eficiente.
-
Se utiliza para resolver los inconvenientes de los algoritmos de aprendizaje supervisado y no supervisado.
Desventajas del aprendizaje semisupervisado
-
Los resultados de las iteraciones pueden no ser estables.
-
No puedes aplicar estos algoritmos a datos a nivel de red.
-
La precisión es baja.
Fuente: Pexels
Como puedes ver, es muy interesante conocer cómo los diferentes tipos de machine learning han cambiado el mundo en el que vivimos y han ayudado a desarrollar la tecnología a un punto que anteriormente resultaba inimaginable.
Si bien saber cuáles son los tres tipos de aprendizaje automático es esencial para sacarle provecho al machine learning, recuerda que el aprendizaje semisupervisado también es indispensable para resolver ciertos problemas del aprendizaje supervisado y no supervisado.
Si el mundo de la Data Science e inteligencia artificial te suena muy atractivo y quieres saber cómo realizar una buena gestión de proyectos tecnológicos, dale un vistazo a nuestros cursos online de inteligencia y ciencia de datos.
¡Muchos éxitos!