Newer
Older
import pandas as pd
# Charger les données depuis le fichier CSV existant
data = pd.read_csv('../Data/combined/calories_combined.csv')
# Formater la colonne 'date' pour ne garder que l'année, le mois et le jour
data['date'] = pd.to_datetime(data['date']).dt.strftime('%Y-%m-%d')
# Remplacer les valeurs -1 par None pour gérer les données manquantes
data = data.replace(-1, None)
# Arrondir les colonnes numériques à 2 décimales
cols = ['Anis', 'Maya', 'Corentin', 'Amira']
data[cols] = data[cols].round(2)
# Exporter les données nettoyées au format JSON
data.to_json('calories_combined_clean.json', orient='records', date_format='iso')
print("Le fichier 'calories_combined_clean.json' a été créé avec succès.")