Aprendizado supervisionado é um paradigma de aprendizado de máquina em que um modelo é treinado usando um conjunto de dados rotulado para fazer previsões ou classificações com base em entradas novas e não rotuladas.
Mas, calma lá vamos explicar isso com detalhes não é?
Sim, em grande parte da nossa vida nós aprendemos de forma supervisionada recebendo exemplos de nosso pais, professores, amigos, ou seja, em quase todas as nossas relações sejam familiares e de trabalho.
Alguns exemplos de como seres humanos aprendem com supervisão são:
Vamos a um exemplo simples de como um humano pode aprender e generalizar alguns tópicos de forma bastante intuitiva. Vamos supor que um cientista no ano de 1670, foi em uma viagem para o centro da floresta amazônica e resolveu catalogar algumas espécies diferentes de animais.
Ao visitar o vilarejo de Tawape o cientista viu várias lagartas nos arredores do vilarejo:
Como o cientista já havia visto algumas lagartas na sua cidade natal, batizou essa lagarta com o nome do vilarejo. Ao seguir sua viagem ele também encontrou uma outra espécie, o Sapo de onogave devido a uma lenda de um Sapo que ele ouviu no folclore do seu país que fala sobre um sapo místico.
Considerando o conhecimento desse cientista, como você classificaria esse novo animal que apareceu em seu jardim?
Você como humano mal percebe o que aconteceu, porém aqui aconteceu um procedimento bastante complexo que os seres humanos se acostumaram a realizar durante a evolução. Esse processo é a generalização por meio de exemplos observados anteriormente. Algumas possíveis suposições que você poderia extrair dessas imagens:
Você percebe que existem algumas incertezas que não podemos concluir apenas com essas imagens?
Essa incerteza acontece por vários motivos e muitos deles tem a ver com a grande variedade de dados e situações no mundo real, assim, dificilmente conseguimos ter 100% de certeza com base em poucas imagens. Veja alguns motivos da nossa dúvida ao classificar essa nova foto.
O Teachable Machine é uma ferramenta desenvolvida pelo Google que permite aos usuários treinarem modelos de aprendizado de máquina sem a necessidade de conhecimento avançado em programação ou ciência de dados. Lançado como uma plataforma acessível e amigável, o Teachable Machine possibilita que pessoas sem experiência técnica explorem e compreendam os conceitos fundamentais de machine learning de maneira prática. Os usuários podem treinar modelos usando exemplos visuais, de áudio ou gestuais, fornecendo dados de entrada e saída para ensinar a máquina a reconhecer padrões e realizar tarefas específicas. Isso democratiza o acesso à tecnologia de aprendizado de máquina, permitindo que pessoas de diversas áreas explorem as potencialidades dessa área em suas próprias aplicações criativas, educacionais ou de desenvolvimento de projetos.
No Teachable Machine, os usuários podem treinar modelos para classificar e reconhecer padrões em dados de entrada personalizados. Isso é feito por meio de uma interface intuitiva, onde os usuários alimentam o modelo com exemplos de diferentes classes e, em seguida, testam sua capacidade de generalização em novos dados. O aprendizado de máquina por trás da ferramenta é simplificado para permitir uma experiência de usuário amigável, tornando o processo de treinamento de modelos mais acessível. O Teachable Machine ilustra a tendência crescente de tornar a inteligência artificial mais compreensível e utilizável por um público mais amplo, incentivando a experimentação e a inovação em diversas áreas por meio do poder do aprendizado de máquina.
Entre no website do teachable machine:
Clique no botão “Get Started”
Se você estiver logado na sua conta google você será automaticamente redirecionado para página inicial da ferramenta. Caso contrário você deverá fazer logon na sua conta Google.
A tela principal deve é essa:
Agora você poderá escolher dos tipos de projeto, para esse exemplo vamos fazer um “image project”:
Ao clicar você será solicitado para escolher qual tipo de imagem você quer usar. Aqui você pode escolher o padrão (melhor para computadores) e se você quiser usar em microcontroladores como arduino ou ESP32 você pode usar o embedded image model. Por agora vamos ficar com o padrão.
A interface de treinamento do seu modelo é essa:
Agora é a hora do nosso treinamento, vamos criar duas classes: cachorro e gato. Essas duas classes serão carregadas com o dataset “cães e gatos” do Kaggle. Essas imagens servirão como uma forma de “exemplo” para ensinar nosso algoritmo a identificar o que é um gato e um cachorro.
Depois de adicionar as fotos vamos clicar em “Train Model”. Após o treinamento temos o modelo pronto para ser pré visualizado.
Clique em “Choose images from your files” e adicione a foto de um cachorro ou de um gatinho e observe o resultado. Ao dar ao sistema um novo exemplo ele consegue classificar se aquilo é realmente um cachorro ou um gato.
Usando esse tipo de abordagem poderiamos criar uma máquina capaz de realizar classificação de diferentes tipos de imagem de forma bastante assertiva. Na indústria 4.0. esse tipo de classificação poderia ser implementado, por exemplo, para separar tomates maduros de tomates verdes. Veja a seguir uma aplicação desse conceito:
Porém, sabemos também que essa tecnologia não é aplicada apenas na área da agricultura. As indústrias também de processamento de alimentos podem utilizar essa tecnologia para detectar problemas em frutas:
Um conjunto de dados no contexto de Inteligência artificial é um conjunto de dados que foram cuidadosamente selecionados para servir de exemplo para o aprendizado de uma IA. Cada exemplo no conjunto de dados é composto por uma entrada e a saída correspondente que o modelo deve aprender a prever.
Os dados de treinamento de uma IA não necessariamente são imagens (como no nosso exemplo anterior), frequentemente, esses dados são expressos por meio de números, categorias, texto, dados temporais, binários, localização e também de audio e vídeo.
Dados Numéricos:
Dados Categóricos:
Dados de Texto:
Dados Temporais: Informações relacionadas a datas e horários (por exemplo, timestamps, datas de eventos).
Dados Binários: Variáveis que têm apenas dois valores possíveis (0 ou 1, verdadeiro ou falso).
Dados Geoespaciais: Informações relacionadas a localizações geográficas (por exemplo, coordenadas geográficas, endereços).
Dados de Imagem e Vídeo: Informações visuais em forma de imagens ou vídeos.
Veja um exemplo abaixo de como podemos encaixar esses tipos de dados em uma tabela:
ID | Nome | Idade | Altura | Núm. Filhos | Cor Fav. | Classificação Satisfação | Descrição Pessoal | Timestamp | Cliente Ativo | Coordenadas Geográficas | Cartão de Fidelidade | Imagem de Perfil |
---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | Maria | 28 | 1.65 | 2 | Azul | Bom | “Extrovertida” | 2023-01-10 08:30:00 | Sim | (40.7128, -74.0060) | Sim | Link |
2 | João | 35 | 1.80 | 1 | Verde | Excelente | “Esportes radicais” | 2023-01-12 15:45:23 | Não | (34.0522, -118.2437) | Não | Link |
3 | Ana | 22 | 1.55 | 0 | Vermelho | Regular | “Estudante de Artes” | 2023-01-15 12:10:45 | Sim | (41.8781, -87.6298) | Sim | Link |
4 | Carlos | 40 | 1.75 | 3 | Amarelo | Excelente | “Empresário e viajante” | 2023-01-20 09:20:12 | Sim | (51.5074, -0.1278) | Sim | Link |
O processo de criação de rótulos, também conhecido como rotulação de dados, é uma etapa crucial em muitos problemas de aprendizado supervisionado. A rotulação envolve atribuir etiquetas ou rótulos aos dados de treinamento para que o algoritmo de aprendizado de máquina possa aprender a relação entre as entradas (características) e as saídas desejadas (rótulos).
Antes de mais nada, precisamos compreender o problema em questão. Assim podemos ter total domínio de quais são as saídas desejadas para as entradas específicas. Por exemplo, se estiver trabalhando em um problema de classificação de imagens, você precisa saber quais categorias ou classes as imagens devem ser rotuladas (igual fizemos no exemplo anterior).
Seleção dos Dados de Treinamento:
Atribuição de Rótulos:
O termo “oráculo” refere-se a uma fonte externa de conhecimento ou um sistema que fornece respostas corretas ou rótulos para dados específicos. O oráculo é usado principalmente em situações em que é necessário obter rótulos ou feedbacks corretos para treinar ou avaliar um modelo de aprendizado de máquina.
Vamos considerar um exemplo prático de como usar um oráculo em um problema de aprendizagem supervisionada para classificar peças como defeituosas ou não defeituosas. Neste caso, o oráculo será um especialista humano que pode rotular corretamente as peças.
Coleta de Dados:
Treinamento Inicial:
Aprendizado Ativo com Oráculo:
Atualização do Modelo:
Iteração:
Avaliação e Uso em Produção:
Neste exemplo, observamos que o oráculo desempenha um papel fundamental na correção de erros do modelo e na melhoria contínua do desempenho, especialmente em situações em que o modelo pode ter dificuldade em casos ambíguos. O aprendizado ativo com o oráculo permite uma abordagem mais eficiente e focada na melhoria do modelo, economizando tempo e recursos.
Esse post foi modificado em 28 de dezembro de 2023 10:57
This website uses cookies.