quinta-feira, 12 de dezembro de 2013

      Olá!
     Hoje falaremos um pouco sobre aprendizado de máquina ou machine learning. Mais especificamente, falaremos sobre a diferença entre aprendizado supervisionado e não supervisionado.

    Imagine que temos uma base com dados sobre os clientes de uma empresa. Uma pergunta que podemos fazer é: será que estes clientes pertencem a diferentes grupos? Neste tipo de pergunta, nosso "alvo" não está exatamente especificado. Queremos saber se os clientes estão agrupados de alguma forma, mas não sabemos qual. Qual não existe um alvo definido, temos um caso de aprendizado não supervisionado.

     Outra pergunta que podemos fazer é: será que podemos segmentar estes clientes em grupos de pessoas que possuem maior probabilidade de cancelar seu contrato com a empresa? Aqui, diferentemente da pergunta anterior, temos um "alvo" específico, que é o grupo de pessoas que provavelmente irão cancelar seu contrato, ou não. Este é o caso em que temos o aprendizado supervisionado.

     Metaforicamente, podemos entender o aprendizado supervisionado como o caso de um professor que auxilia o aprendizado com base em um conjunto específico de exemplos. O caso não supervisionado pode envolver o mesmo conjunto, só que sem a informação de qual é o alvo.

     Tarefas como classificação ou regressão são resolvidas com métodos supervisionados, enquanto uma tarefa de agrupamento é geralmente não supervisionada. No caso de uma classificação, temos como alvo um dado categórico (geralmente binário). Em uma regressão temos um alvo numérico.

     Abaixo, temos uma ilustração sobre os métodos de aprendizado.


     
     


     Um abraço e até o próximo post.


            Data Science for Business - Foster Provost & Tom Fawcett

0 comentários:

Postar um comentário