Use este identificador para citar ou linkar para este item:
https://repositorio.unisagrado.edu.br/jspui/handle/handle/1635
Título: | COMPARAÇÃO DE TÉCNICAS DE CLASSIFICAÇÃO PARA DETECÇÃO DE SPAM |
Autor(es): | FIRMINO, JULIANO |
Orientador(es): | Martins, Henrique Pachioni |
Palavras-chave: | Inteligência Artificia;Aprendizagem de Máquina;Descoberta de Conhecimento em Base de Dados;E-mails spam e não spam;Weka |
Data do documento: | 2015 |
Editor: | Centro Universitário Sagrado Coração - UNISAGRADO |
Resumo: | Spam é um problema tanto para usuários comuns quanto para servidores de e-mails e provedores de internet, sendo que umas das soluções mais utilizadas são filtros AntiSpam, utilizados em provedores de internet. Este estudo utilizou-se de técnicas de Inteligência Artificial, por meio de algoritmos de aprendizagem de máquina do software Weka, para fazer uma análise de classificação e comparação, ente o desempenho de três técnicas de aprendizado de máquina: árvore de decisão (J48), NaivesBayes e k-vizinhos mais próximos (K-NN). Para os testes foi utilizada uma base de dados com 500 e-mails, sendo 250 spams e 250 não spams, todos retirados de uma conta légitima do Gmail. Entre os algoritmos testados, o k-vizinhos mais próximos (K-NN), sem a utilização de stopwords, obteve o melhor resultado na classificação de e-mail com 92.6% de acertos. O algoritmo Naive Bayes, teve uma taxa de 91% de erros. A técnica de árvores de decisão (J48) apresentou a pior taxa de acertos com aproximadamente 87%. |
URI: | https://repositorio.unisagrado.edu.br/jspui/handle/handle/1635 |
Aparece nas coleções: | Trabalhos de Conclusão de Curso |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Comparacao de tecnicas de classificacao para deteccao de spam.pdf | Trabalho de Conclusão de Curso | 9,02 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.