Projet
Pour la présentation de flask j'ai décidé d'utiliser une base que j'ai faite en cours qui est celui de la prédiction d'un spam ou d'un message par mail ou Sms J'ai utilisé au débuts Le notebook Jupiter pour effectuer des tests sur la base de données
On importe en premier les librairies nécessaires pour l'exploitation des données ainsi que le jeu de données qui est "SMSSpam2.csv" qui as étais nettoyé et trié avant l'importation Et on a affiché les 5 première lignes
On calcule la fréquence des messages sur leur nombre de caractères, ainsi que la différence il y as entre un Ham (un message) et un Spam On fait des statistiques sur le jeu de données, le total (count), la moyenne (mean), l'écart type (std), le minimum (min), le maximum (max), et les quartiles (25, 50 et 75%)
On va demander à regrouper les mots en deux catégories ceux qui reconnais en Spam et ceux en Ham et on va lui demander d'afficher les mots les plus utilisé
Les mots considéré en spam ici sont affiché ici
Liste des mots utilisé dans les spam et leur fréquence d'utilisation
On crée un DataFrame pour qu'ensuite on puisse faire un KNN
Création du KNN, entrainement du modèle avec un résultat de 0.95%
Ensuite sur Visual Studio on crée le "moteur" de la prediction en python
Puis la page en html qui sert d'interface Utilisateur / "IA"
Le CSS de la page pour avoir un rendu plus jolie, assez simple mais risque de changé au cours du temps