Escola Superior de Tecnologia Análise de Dados Biomédicos
Ficha 3 – Visualização •
Execute a aplicação WEKA: =>Start=>Programs=>WEKA=>Weka-3-4
•
Escolha o modo Explorer.
•
Abra o ficheiro contact-lenses.arff: =>Open File...=>\data=>contact-lenses.arff
1. Qual é o assunto tratado neste ficheiro? 2. Fazendo variar o atributo (painel da esquerda), observe a distribuição das instâncias nos gráficos (painel da direita). Visualize simultaneamente todos os gráficos (Visualize All). Tendo cuidado para que o atributo escolhido para classe seja contact-lenses e variando os restantes atributos, parece-lhe haver algum par atributo/valor que permita criar uma boa regra de classificação? Qual e porquê? 3. Escolha a tab visualize, escolha o primeiro quadrado e atribua a jitter um valor intermédio. Faça variar o atributo na primeira drop-box e observe os gráficos. Esta observação coincide com a sua resposta anterior? Porquê? 4. Utilizando os eixos dos X e dos Y para representar atributos e a cor para as classes, encontre um conjunto de regras utilizando apenas dois atributos como o mínimo de erros de classificação possíveis. 5. Abra com o weka o ficheiro zoo.arff fornecido. Fazendo variar o atributo e observando a distribuição das instâncias nos gráficos da classe, há algum atributo que deva ser removido dos dados? Justifique. 6. Utilizando os seus conhecimentos e com a ajuda das ferramentas de vizualização do weka, construa e apresente um conjunto de regras para classificar os animais na respectiva família. 7. Edite o ficheiro zoo.arff e transforme o atributo legs num atributo nominal com valores {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}. Abra o ficheiro no Weka, retire o atributo animal e escolha a tab Classify. Escolha o algoritmo Prism (choose=>rules=>prism) e execute-o (start). Apresente a solução encontrada e compare-a com a sua, especialmente em termos de legibilidade e de desempenho (percentagem de instâncias correctamente classificadas). 8. Escolha agora o algoritmo UserClassifier (choose=>trees=>userclassifier). Utiliza a janela apresentada para criar uma árvore que classifique os animais na respectiva família. Apresente a sua árvore. 9. Escolha o algoritmo ID3 (choose=>trees=>ID3) e execute-o. Copie a árvore encontrada, comparando-a com a sua, mais uma vez em termos de legibilidade e de desempenho.
Licenciatura em Informática para a Saúde
ADB – Análise de Dados Biomédicos