Ce projet vise à développer une application web interactive utilisant Streamlit pour l'analyse approfondie de données culinaires. L'application met en pratique les compétences avancées en développement Python, analyse de données, et développement web.
- Statistiques nutritionnelles détaillées
- Visualisation des tendances culinaires
- Analyse comparative des ingrédients
- Système de recommandation personnalisé basé sur les préférences
- Analyse des contributions des utilisateurs
- Exploration des distributions des interactions
- Visualisations interactives des données
Avant d'exécuter le code, assurez-vous que les éléments suivants sont installés et configurés :
Les variables d'environnement se trouvent dans le fichier .env
- Python 3.11 ou supérieur
- Poetry pour la gestion des dépendances. Installer Poetry
- Docker (optionnel, pour le déploiement local) : Installer Docker
- Compte MongoDB Atlas ou base de données MongoDB(optionnel, pour ligne ou en local à partie de mongodb) : Installer MongoDB
git clone https://github.com/mbathe/projet_kit_big_data.git
cd projet_kit_big_data
poetry install
poetry shell
Exécutez l'instruction suivante à la racine du projet pour télécharger le dataset et l'enregistrer à l'emplacement par défaut ./data/dataset/
(défini par la variable d'environnement DOCKER_DOWNLOAD_DATASET_DIR). Vous pouvez modifier cet emplacement en modifiant la valeur de cette variable.
poetry run python script.py
À la racine du répertoire du projet, exécutez la commande suivante :
streamlit run src/Recettes.py
git clone https://github.com/mbathe/projet_kit_big_data.git
cd projet_kit_big_data
docker build -t projet_kig_big_data .
À la racine du répertoire du projet, exécutez la commande suivante :
docker run -d --name projet_big_data1 --memory="2g" -p 8501:8501 projet_kig_big_data
git clone https://github.com/mbathe/projet_kit_big_data.git
cd projet_kit_big_data
poetry install
Avant de déployer l'application, donnez des valeurs aux variables d'environnement suivantes du fichier .env
:
# CHAÎNE DE CONNEXION À LA BASE DE DONNÉES MONGODB POUR UN DÉPLOIEMENT EN LIGNE
CONNECTION_STRING =
# NOM DE LA BASE DE DONNÉES À UTILISER
DATABASE_NAME = tp_big_data
# NOM DE LA COLLECTION POUR SAUVEGARDER LES RECETTES DANS MONGODB
COLLECTION_RECIPES_NAME = recipes
# NOM DE LA COLLECTION POUR SAUVEGARDER LES INTERACTIONS DANS MONGODB
COLLECTION_RAW_INTERACTIONS = raw_interaction
python scripts/mongo_data.py
À la racine du répertoire du projet, exécutez la commande suivante :
streamlit run src/Recettes.py
- Streamlit Cloud : Lien de l'application
- VPS Local : http://158.178.192.72:8501/
- Documentation de l'application : https://documentation-projet-kit-big-data.readthedocs.io/en/latest/
Nom | Rôle | Contact |
---|---|---|
MBATHE MEKONTCHOU PAUL | Data Scientist | [https://github.com/mbathe] |
Alexandre Desgrées du Loû | Data Scientist | [https://github.com/Alexandre-ddl] |
Alexandre Movsessian | Data Scientist | [https://github.com/AlexMovsess] |
Julian Sliva | Data Scientist | [https://github.com/JuJuFR78] |