Nesse post vamos aprender um pouco como realizar a análise de dados usando a ferramenta WEKA. Para isso, vamos usar alguns dados da área da medicina, uma das mais prestigiadas e importantes áreas da ciência. Curar doenças e detecta-las muitas vezes passa pelo crivo de profissionais renomados e de anos de experiência para que o resultado seja satisfatório. No entanto, esta área tem sido “invadida” pela tecnologia e cada dia mais os médicos têm contado com exames, robôs cirurgiões, literatura na palma da mão, etc. Todos estes recursos permitem que o profissional desempenhe melhor seu trabalho.
Neste artigo veremos como é possível utilizar a ciência da computação e técnicas de Inteligência Artificial (reconhecimento de padrões) para conseguir um diagnóstico.
Nós gostamos muito de postar conteúdo sobre ciência de dados. Veja mais sobre isso aqui.
Para reconhecer se algo é normal ou não, precisamos primeiro saber o que é normal. certo? Inconscientemente nós fazemos isso o tempo todo. Por exemplo, observamos o rosto de pessoas todos os dias, conhecemos diversas expressões, traços de idade, imperfeições, maquiagem, etc.
Mas quando vemos algo diferente, logo nosso cérebro nos manda um sinal… Opa! isso não é normal.
Então, podemos dizer que o normal depende muito do que você já viu como exemplos e julgará ao final a “normalidade”. Imagine que você vive em um local que todas as pessoas possuem 6 dedos, qual sua reação a ver uma pessoa com 5 dedos?
O dataset escolhido contém dados numéricos sobre a coluna do paciente e usa os dados para classificar uma exemplo em normal ou anormal. Neste conjunto de dados, estão presentes 310 exemplos, 13 atributos, 12 atributos numéricos, 1 classe binária.
O dataset foi extraído de um repositório publico e está disponível aqui.
A dor lombar pode ser causada por uma variedade de problemas em qualquer parte da complexa e interconectada rede de músculos, nervos, ossos, discos ou tendões da coluna lombar.
Fontes típicas de dor lombar incluem:
Embora a dor lombar seja extremamente comum, os sintomas e a gravidade da dor lombar variam muito. Uma simples distensão do músculo lombar pode ser excruciante o suficiente para exigir uma visita à sala de emergência, enquanto um disco em degeneração pode causar apenas desconforto leve e intermitente
O algoritmo J48, desenvolvido por Ross Quinlan, constrói árvores de decisão a partir de um conjunto de dados de treinamento. As árvores de decisão geradas pelo algoritmo podem ser utilizadas para classificação, logo são conhecidas como classificadores estatísticos.
CART ou Classification And Regression Tree (árvore de classificação e regressão) é um algoritmo usado na mineração de dados que usa dois conceitos principais: A análise da árvore de classificação é feita quando o resultado previsto é a classe à qual os dados pertencem. A análise de árvore de regressão é quando o resultado previsto pode ser considerado um número real (por exemplo, o preço de uma casa ou o tempo de permanência de um paciente em um hospital). Esse algoritmo usa a métrica de Gini para dividir as categorias em grupos separados.
Os algoritmos citados foram aplicados utilizando o Weka. Faça download da ferramenta aqui.
Ao utilizar o J48 com as seguintes opções:
Com estes dados, o algoritmo foi treinado para receber um novo exemplo e a partir do modelo construído podemos avaliar com uma precisão de 84.5% se uma coluna é anormal e 75% se a coluna é normal. Este modelo poderia auxiliar médicos a realizar um diagnóstico com maior agilidade e precisão.
Esse post foi modificado em 11 de abril de 2024 09:40
This website uses cookies.