2 - Bucket de dépôt

Dans cette partie nous créons le bucket de dépôt dans la région Europe West 1 puis nous chargeons les fichiers de données.

Création avec la console

Nous allons manipuler les buckets de stockage au travers de la console cloud storage.

Sur l’interface de cloud storage, cliquez sur le bouton Créer pour créer un nouveau bucket et configurez le de la façon suivante:

  • nom du bucket: <PREFIX>-stacklabs-dpsw-lz

  • emplacement de stockage: régional sur europe-west1 (Belgique)

  • classe de stockage par défaut

  • contrôle d’accès aux objets par défaut (contrôle d’accès uniforme)

  • aucune protection des données des objets

bucket creation

  • dpsw est l’acronyme de data-platform-serverless-workshop

  • lz est l’acronyme de landing zone

Une fois la configuration requise établi, cliquez sur Créer.

Création avec la CLI

Dans cette partie la CLI gcloud est utilisé pour créer le bucket. Il suffit de lancer la commande suivante:

Λ\: $ gsutil mb -p ${PROJECT} -l europe-west1 gs://${PREFIX}-stacklabs-dpsw-lz

Notre bucket apparaît maintenant dans la console cloud

Chargement des fichiers

✏ Les fichiers utilisés pour le workshop peut être trouvée sur ce bucket. Vous pouvez les télécharger pour les importer dans l’étape suivante.

✏ Cliquez sur le nom du bucket puis sur le bouton IMPORTER DES FICHIERS

✏ Dans la boîte de dialogue, sélectionnez le fichier CSV des départements ("departements-france.csv") ainsi que le fichier des naissances ("naissances-part-1.csv")

storage files

Vous pouvez aussi utiliser la commande suivante dans cloud shell pour copier les fichiers dans votre bucket:

Λ\: $ gsutil cp gs://dpsw-raw-data/* gs://${PREFIX}-stacklabs-dpsw-lz/