La búsqueda global no está activada.
Salta al contenido principal
Foro

Foro de debate módulo 6

Aprendizaje supervisado vs. no supervisado / Supervised vs. unsupervised learning

Aprendizaje supervisado vs. no supervisado / Supervised vs. unsupervised learning

de Jesús Alcalá Fernández - Número de respuestas: 2

Hola a tod@s.


Nos gustaría debatir con vosotros sobre el siguiente tema:


¿Qué diferencias hay entre el aprendizaje supervisado y el no supervisado? ¿Para qué o cuándo debemos utilizar las técnicas de Aprendizaje no Supervisado?


--------------------------------------------------

Hello everyone.


We would like to discuss the following topic with you:


What are the differences between supervised and unsupervised learning? For what or when should we use Unsupervised Learning techniques?

En respuesta a Jesús Alcalá Fernández

Re: Aprendizaje supervisado vs. no supervisado / Supervised vs. unsupervised learning

de María Isabel Aranda Olmedo -
¡Hola!
En el aprendizaje supervisado los datos se etiquetan previamente para guiar al algoritmo a la salida a la que "debe" llegar (los datos etiquetados servirán para hacer predicciones sobre nuevos datos no etiquetados). En el aprendizaje no supervisado los datos no tienen referencias (etiquetas) que indiquen el tipo de salida (no hay datos de entrenamiento). Los algoritmos agrupan los datos según sus características (identificando patrones).

Podría decirse que en el aprendizaje no supervisado el proceso se deja más "en manos" de la IA que en el aprendizaje supervisado, en el que tiene papel protagonista el "data scientist".

Al ser aprendizajes diferentes, se emplean para fines diferentes. El aprendizaje supervisado se emplea para análisis predictivos o para la clasificación de datos. Pero no siempre se conoce el tipo de salida. Este es el caso en el que se debe recurrir al aprendizaje no supervisado. El aprendizaje no supervisado es útil para desentrañar la estructura y comprender qué relaciones existen dentro de un conjunto de datos. Se obtiene así información y conocimiento que, de otro modo, podría quedar oculto a nuestros ojos.

Otra diferencia es que el aprendizaje supervisado requiere más recursos humanos (y, por tanto, económicos) que el aprendizaje no supervisado. Además, del aprendizaje no supervisado, a veces, lo complejo será entender qué criterio llevó a la IA a establecer ciertas relaciones entre los datos.

M. Isabel.
--------------------------------------
Hello!
In supervised learning, data is pre-labeled to guide the algorithm to the output it "should" arrive at (the labeled data will be used to make predictions about new, unlabeled data). In unsupervised learning, the data has no references (labels) that indicate the type of output (there is no training data). The algorithms group the data according to its characteristics (identifying patterns).

It could be said that in unsupervised learning, the process is left more "in the hands" of AI than in supervised learning, where the data scientist plays a leading role.

Because these are different learning methods, they are used for different purposes. Supervised learning is used for predictive analytics or data classification. However, the type of output is not always known. This is the case where unsupervised learning must be used. Unsupervised learning is useful for unraveling the structure and understanding what relationships exist within a data set. This provides information and knowledge that might otherwise be hidden from us.

Another difference is that supervised learning requires more human (and therefore financial) resources than unsupervised learning. Furthermore, with unsupervised learning, it's sometimes difficult to understand what led the AI ​​to establish certain relationships between the data.

M. Isabel.
En respuesta a María Isabel Aranda Olmedo

Re: Aprendizaje supervisado vs. no supervisado / Supervised vs. unsupervised learning

de Jesús Alcalá Fernández -
Buenas tardes.

¡Muchas gracias por tu mensaje y participación, María Isabel!

Como comentas, el aprendizaje NO supervisado suele ser mucho más desafiante que el aprendizaje supervisado ya que en este caso no disponemos de una variable que queremos predecir, no se basa en la existencia de una respuesta previamente conocida, por lo que el aprendizaje no se supervisa como un maestro haría con un estudiante, proporcionando la respuesta correcta después de cada intento fallido del estudiante. Debido a ello no disponemos de ningún tipo de validación basada en el conocimiento de ningún tipo de valores de salida. La pregunta a responder en este caso sería: ¿es la información que hemos descubierto fiable o interesante? Además, este tipo de aprendizaje presenta los mismos tipos de problemas que el aprendizaje supervisado pero agravados por lo que acabamos de comentar.

Este tipo de aprendizaje permite extraer/descubrir información/cosas interesante de nuestro problema, mediante el descubrimiento de asociaciones (por ejemplo, identificando patrones frecuentes o asociaciones ocultas entre los elementos de la BD), agrupamiento de ejemplos (por ejemplo, identificando subgrupos de pacietes que puede tener relevancia clínica, permitiendo tratamientos más personalizados y eficaces.) o variables (por ejemplo, identificando relaciones existen entre las variables del estudio), etc, por lo que su aplicación tiende a ser más subjetiva y no existe un único objetivo claro para el análisis. Esto hace que no exista un pathway único para aplicar estas técnicas y que el resultado obtenido dependa aun más del analista de datos.

De hecho, aunque tengamos un problema de regresión o clasificación, estas técnicas se suelen aplicar a menudo como parte de un análisis exploratorio de datos que se debe realizar siempre antes de empezar a trabajar con los datos con el objetivo de conocer mejor nuestro problema, identificar sesgos, etc.

Comentas que el aprendizaje supervisado requiere más recurso humanos, y por lo tanto económicos. Pensáis lo mismo?

Un saludo
Jesus

------------------------------------------------------------

Good afternoon.

Thank you very much for your message and participation, María Isabel!

As you comment, NON supervised learning is usually much more challenging than supervised learning since in this case we do not have a variable that we want to predict, it is not based on the existence of a previously known response, so the learning is not supervised as a teacher would do with a student, providing the correct answer after each failed attempt of the student. Because of this we do not have any kind of validation based on knowledge of any kind of output values. The question to answer in this case would be: is the information we have discovered reliable or interesting? Furthermore, this type of learning presents the same types of problems as supervised learning but aggravated by what we have just discussed.

This type of learning allows us to extract/discover interesting information/things from our problem, through the discovery of associations (for example, identifying frequent patterns or hidden associations between DB elements), grouping of examples (for example, identifying subgroups of patients that may have clinical relevance, allowing more personalized and effective treatments) or variables (for example, identifying relationships between study variables), etc, so its application tends to be more subjective and there is no single clear objective for the analysis. This means that there is no single pathway for applying these techniques and the result obtained depends even more on the data analyst.

In fact, even if we have a regression or classification problem, these techniques are often applied as part of an exploratory data analysis that should always be performed before starting to work with the data in order to better understand our problem, identify biases, etc.

You say that supervised learning requires more human and therefore economic resources. Do you think the same?

Sincerely,
Jesus