Buenas tardes.
¡Muchas gracias por tu mensaje y participación, María Isabel!
Como comentas, el aprendizaje NO supervisado suele ser mucho más desafiante que el aprendizaje supervisado ya que en este caso no disponemos de una variable que queremos predecir, no se basa en la existencia de una respuesta previamente conocida, por lo que el aprendizaje no se supervisa como un maestro haría con un estudiante, proporcionando la respuesta correcta después de cada intento fallido del estudiante. Debido a ello no disponemos de ningún tipo de validación basada en el conocimiento de ningún tipo de valores de salida. La pregunta a responder en este caso sería: ¿es la información que hemos descubierto fiable o interesante? Además, este tipo de aprendizaje presenta los mismos tipos de problemas que el aprendizaje supervisado pero agravados por lo que acabamos de comentar.
Este tipo de aprendizaje permite extraer/descubrir información/cosas interesante de nuestro problema, mediante el descubrimiento de asociaciones (por ejemplo, identificando patrones frecuentes o asociaciones ocultas entre los elementos de la BD), agrupamiento de ejemplos (por ejemplo, identificando subgrupos de pacietes que puede tener relevancia clínica, permitiendo tratamientos más personalizados y eficaces.) o variables (por ejemplo, identificando relaciones existen entre las variables del estudio), etc, por lo que su aplicación tiende a ser más subjetiva y no existe un único objetivo claro para el análisis. Esto hace que no exista un pathway único para aplicar estas técnicas y que el resultado obtenido dependa aun más del analista de datos.
De hecho, aunque tengamos un problema de regresión o clasificación, estas técnicas se suelen aplicar a menudo como parte de un análisis exploratorio de datos que se debe realizar siempre antes de empezar a trabajar con los datos con el objetivo de conocer mejor nuestro problema, identificar sesgos, etc.
Comentas que el aprendizaje supervisado requiere más recurso humanos, y por lo tanto económicos. Pensáis lo mismo?
Un saludo
Jesus
------------------------------------------------------------
Good afternoon.
Thank you very much for your message and participation, María Isabel!
As you comment, NON supervised learning is usually much more challenging than supervised learning since in this case we do not have a variable that we want to predict, it is not based on the existence of a previously known response, so the learning is not supervised as a teacher would do with a student, providing the correct answer after each failed attempt of the student. Because of this we do not have any kind of validation based on knowledge of any kind of output values. The question to answer in this case would be: is the information we have discovered reliable or interesting? Furthermore, this type of learning presents the same types of problems as supervised learning but aggravated by what we have just discussed.
This type of learning allows us to extract/discover interesting information/things from our problem, through the discovery of associations (for example, identifying frequent patterns or hidden associations between DB elements), grouping of examples (for example, identifying subgroups of patients that may have clinical relevance, allowing more personalized and effective treatments) or variables (for example, identifying relationships between study variables), etc, so its application tends to be more subjective and there is no single clear objective for the analysis. This means that there is no single pathway for applying these techniques and the result obtained depends even more on the data analyst.
In fact, even if we have a regression or classification problem, these techniques are often applied as part of an exploratory data analysis that should always be performed before starting to work with the data in order to better understand our problem, identify biases, etc.
You say that supervised learning requires more human and therefore economic resources. Do you think the same?
Sincerely,
Jesus
¡Muchas gracias por tu mensaje y participación, María Isabel!
Como comentas, el aprendizaje NO supervisado suele ser mucho más desafiante que el aprendizaje supervisado ya que en este caso no disponemos de una variable que queremos predecir, no se basa en la existencia de una respuesta previamente conocida, por lo que el aprendizaje no se supervisa como un maestro haría con un estudiante, proporcionando la respuesta correcta después de cada intento fallido del estudiante. Debido a ello no disponemos de ningún tipo de validación basada en el conocimiento de ningún tipo de valores de salida. La pregunta a responder en este caso sería: ¿es la información que hemos descubierto fiable o interesante? Además, este tipo de aprendizaje presenta los mismos tipos de problemas que el aprendizaje supervisado pero agravados por lo que acabamos de comentar.
Este tipo de aprendizaje permite extraer/descubrir información/cosas interesante de nuestro problema, mediante el descubrimiento de asociaciones (por ejemplo, identificando patrones frecuentes o asociaciones ocultas entre los elementos de la BD), agrupamiento de ejemplos (por ejemplo, identificando subgrupos de pacietes que puede tener relevancia clínica, permitiendo tratamientos más personalizados y eficaces.) o variables (por ejemplo, identificando relaciones existen entre las variables del estudio), etc, por lo que su aplicación tiende a ser más subjetiva y no existe un único objetivo claro para el análisis. Esto hace que no exista un pathway único para aplicar estas técnicas y que el resultado obtenido dependa aun más del analista de datos.
De hecho, aunque tengamos un problema de regresión o clasificación, estas técnicas se suelen aplicar a menudo como parte de un análisis exploratorio de datos que se debe realizar siempre antes de empezar a trabajar con los datos con el objetivo de conocer mejor nuestro problema, identificar sesgos, etc.
Comentas que el aprendizaje supervisado requiere más recurso humanos, y por lo tanto económicos. Pensáis lo mismo?
Un saludo
Jesus
------------------------------------------------------------
Good afternoon.
Thank you very much for your message and participation, María Isabel!
As you comment, NON supervised learning is usually much more challenging than supervised learning since in this case we do not have a variable that we want to predict, it is not based on the existence of a previously known response, so the learning is not supervised as a teacher would do with a student, providing the correct answer after each failed attempt of the student. Because of this we do not have any kind of validation based on knowledge of any kind of output values. The question to answer in this case would be: is the information we have discovered reliable or interesting? Furthermore, this type of learning presents the same types of problems as supervised learning but aggravated by what we have just discussed.
This type of learning allows us to extract/discover interesting information/things from our problem, through the discovery of associations (for example, identifying frequent patterns or hidden associations between DB elements), grouping of examples (for example, identifying subgroups of patients that may have clinical relevance, allowing more personalized and effective treatments) or variables (for example, identifying relationships between study variables), etc, so its application tends to be more subjective and there is no single clear objective for the analysis. This means that there is no single pathway for applying these techniques and the result obtained depends even more on the data analyst.
In fact, even if we have a regression or classification problem, these techniques are often applied as part of an exploratory data analysis that should always be performed before starting to work with the data in order to better understand our problem, identify biases, etc.
You say that supervised learning requires more human and therefore economic resources. Do you think the same?
Sincerely,
Jesus