Busrides is in the beta phase of development. Regular site updates are made to enhance your experience!

× Success! Thank you for your feedback.

Qu'est-ce que les données ?

Données 01-06-2020

Épisode 17

Au gouvernement du Canada (GC), le manque de données n’est pas un problème. En fait, c’est plutôt le contraire : il y a souvent trop de renseignements disponibles provenant de trop de sources différentes pour prendre une décision éclairée.

Dans cet épisode, vous découvrirez :

  • les définitions et l’analyse des données;
  • les 2 types de données;
  • les 2 classifications de données;
  • les 5 étapes d’analyse des données pour répondre à une question opérationnelle; et
  • le rôle d’un dirigeant principal des données (DPD).

En 2018, le gouvernement du Canada a publié un guide intitulé Feuille de route de la Stratégie des données pour la fonction publique fédérale pour permettre aux ministères de réfléchir à la façon dont ils pourraient tirer profit de la valeur de leurs données et de passer à un modèle opérationnel axé sur les données.

Le volume de données que les gouvernements, les entreprises et les Canadiens produisent croît de façon exponentielle, sous l’impulsion des technologies numériques. Les organisations changent leurs modèles opérationnels, acquièrent de nouvelles compétences et conçoivent de nouvelles façons de gérer et de valoriser leurs données. Les gouvernements doivent évoluer rapidement pour suivre le rythme. - Feuille de route de la Stratégie des données pour la fonction publique fédérale

Nous savons qu’ils ont été confrontés à des problèmes similaires lorsqu’ils ont essayé de tirer profit de leurs données; atteindre l’état final est décourageant. L’introduction du rôle de DPD a constitué une partie de cette évolution.

Photo de Sandy Kyriakatos
Sandy Kyriakatos

En 2016, Sandy Kyriakatos est devenue la toute première dirigeante principale des données de la fonction publique fédérale. Elle nous en parle en long et en large dans la conversation ci-dessous afin de vous permettre de découvrir ce qui tient une DPD éveillée la nuit, ainsi que la différence entre un DPD et un chef du numérique, et comment elle a appris à parler le « governese ». Alerte au divulgâcheur, le conseil numéro un de Sandy pour tout fonctionnaire est de :

trouver comment les données peuvent vous aider à mieux faire votre travail.

À quoi ressemble une organisation axée sur les données?

Netflix est un excellent exemple d’organisation guidée par les données. L’entreprise exploite les données pour influencer les décisions qui touchent les consommateurs (quelle émission devrais-je regarder ensuite?) et les entreprises (dans quelles émissions devrions-nous investir?).

Maintenant, imaginez cela dans le contexte gouvernemental : des données qui influencent les décisions des Canadiens (quels programmes sociaux devrais-je demander?) ainsi que la stratégie interne (dans quels programmes sociaux devrions-nous investir?). Une organisation axée sur les données doit recourir à des données de haute qualité, en plus d’avoir un accès élargi, d’une culture des données et d’un processus décisionnel appropriés.

Qu’est-ce que les données?

L’utilisation du mot « donnée » s’est grandement répandue dans la dernière décennie. Les gens, les entreprises et les gouvernements l’utilisent sans savoir exactement de quoi il s’agit.

Les données sont des faits qui peuvent être analysés pour générer des informations.

Deux types de données

Pour certains, les données se limitent à ce qui vient avec votre forfait mensuel de cellulaire. Cependant, les données se présentent sous de nombreux formats : textes, numériques, audio, vidéo, images, codes, logiciels et instruments. On définit habituellement les données en faisant la distinction entre les données qualitatives et quantitatives.

Les données qualitatives comprennent les énoncés descriptifs qui peuvent être faits sur un sujet à partir d’observations, d’entrevues ou d’évaluations. Les critiques de films ou les listes de biens immobiliers en sont 2 exemples. Les photographies, les vidéos et les enregistrements sonores peuvent également être considérés comme des données qualitatives.

Les données quantitatives sont des informations numériques acquises par la mesure ou le comptage. Elles se rapportent habituellement à une certaine quantité ou gamme. Le nombre de personnes qui assistent à une partie de baseball, le temps passé dans la circulation et votre taille sont tous des données quantitatives. La plupart des ministères ont des données quantitatives sur leur nombre d’employés ou sur le nombre de clients qu’ils ont servis ce mois-ci.

Sièges de stade numérotés.
Photo par Paul Bergmeir / Unsplash

Bien que les données qualitatives puissent être converties en données quantitatives, le contraire n’est pas applicable.

Deux classifications de données

Les données structurées sont très organisées et faciles à analyser. Quand il est question de données structurées, pensez à des choses qui s’inscriraient facilement à une feuille de calcul. Voici quelques exemples :

  • dates;
  • numéros de téléphone;
  • codes postaux;
  • nom des clients;
  • types de prestations.

Les données non structurées sont tout le contraire. Ce sont des renseignements bruts et désorganisés qui peuvent avoir leur propre structure interne, mais qui ne s’inscrivent pas parfaitement à une feuille de calcul ou à une base de données. Il s’agit généralement de textes lourds et plus subjectifs, comme les réponses à des questions ouvertes, car chacune d’elles est potentiellement différente et difficile à catégoriser.

Exemples de données non structurées :

  • fichiers audio et vidéo, images;
  • documents Word, présentations PowerPoint, courriels, notes des clients et journaux de conversation;
  • courriels;
  • commentaires des clients;
  • textos;
  • notes de clients et sites de clavardage;
  • enregistrements de centre d’appel.
Une personne qui écrit une liste de vérification.
Photo par Glenn Carstens-Peters / Unsplash

Ces exemples sont en grande partie générés par des humains, mais les données générées par la machine peuvent également être non structurées, notamment les images satellitaires, les données scientifiques, les images et vidéos de surveillance ou les données des capteurs météorologiques.

L’analyse des données est le processus qui consiste à évaluer les données à l’aide d’outils analytiques et statistiques pour découvrir des renseignements utiles. Il existe de nombreuses façons de le faire, notamment l’exploration de données, l’analyse de textes, l’intelligence organisationnelle et la visualisation de données.

Vous savez maintenant ce que sont les données, mais comment pouvez-vous les utiliser pour prendre de meilleures décisions?

Au gouvernement du Canada, le manque de données n’est pas un problème courant. Avec autant de données à trier, vous devez :

  • connaître les bonnes données pour répondre à votre question;
  • être capable de les analyser et d’en tirer des renseignements utiles;
  • tirer des conclusions précises de ces données.

Les données sont-elles réservées aux scientifiques de données?

Certainement pas! Les données sont partout. Tout le monde se doit de les utiliser, tout le monde a besoin de s’y mettre, tout le monde a besoin d’apprendre. Il faut donc répondre à la tâche colossale de permettre à tous les membres d’une organisation de détenir des données. Il faut posséder une bonne connaissance des données pour son travail afin que nous puissions vraiment tirer profit des données. — Sandy Kyriakatos

Voici 5 étapes pour vous aider :

Étape 1: Définissez vos questions

Lorsque vous analysez les données de votre organisation ou de votre entreprise, choisissez d’abord les bonnes questions; elles doivent être mesurables, claires et concises.

Commencez par un problème clairement défini. Par exemple : un centre d’appels du gouvernement reçoit un grand nombre d’appels et les clients sont frustrés. Posez-vous la question suivante : Le centre d’appels peut-il revoir ses opérations pour réduire les temps d’attente?

Étape 2: Mesurez

A) Déterminez ce qu’il faut mesurer

À l’aide de l’exemple ci-dessus, considérez le type de renseignements dont vous auriez besoin : volume d’appels, types de demandes de renseignements sur les clients, temps d’attente, nombre d’employés et pourcentage consacré aux fonctions commerciales obligatoires (en temps). En répondant à cela, vous devrez probablement répondre à de nombreuses sous-questions : p. ex., le personnel est-il sous-utilisé ou surutilisé? Le cas échéant, quelles améliorations aux processus seraient utiles? En cas de restructuration du personnel, comment le centre d’appels répondrait-il à une hausse subite des demandes?

B) Déterminez la façon de mesurer

Il est important de tenir compte de la façon de mesurer vos résultats, car la méthode viendra ensuite soutenir ou discréditer votre analyse. Par exemple : si vous recueillez des données annuelles, mais que vous avez besoin de données quotidiennes pour valider votre hypothèse, les données ne seront pas utiles. Voici quelques questions clés à poser à cette étape :

  • Quel est votre échéancier? (p. ex., quotidien, mensuel, trimestriel)
  • Quelle est votre unité de mesure? (p. ex., volume d’appels, temps d’attente)
  • Quels facteurs devraient être inclus? (p. ex., types de demandes de renseignements des clients)

Étape 3: Faites la collecte

  • Déterminez quelles informations pourraient être tirées des bases de données existantes ou des sources disponibles; vous devrez d’abord les recueillir.
  • Documentez les sources de données (p. ex., Google Analytics, données de recensement) lorsque vous présentez l’information à d’autres personnes.
  • Protégez les données que vous recueillez et stockez-les dans un endroit approprié (p. ex., dans des GCDocs).

Vous n’êtes pas seul! De plus en plus de ministères créent le poste de dirigeant principal des données pour aider à cette tâche à plus grande échelle :

Le bureau de la dirigeante principale des données est responsable de la gestion des données, ainsi que de la valorisation des actifs de données de l’organisation. Que ce soit de la gestion des données, de la gouvernance des données ou de l’analyse des données, de l’amélioration de la culture des données [...], il faut gérer nos données afin que nous puissions mieux servir nos clients. — Sandy Kyriakatos

Étape 4: Menez une analyse

Une fois que vous avez recueilli les bonnes données pour répondre à votre question de l’étape 1, il est temps de les examiner de près.

Vous ne savez pas ce que les données vont vous dire jusqu'à ce que vous vous-en salissiez les mains. - Sandy Kyriakatos

Commencez par manipuler vos données différemment; p. ex., en les traçant et en trouvant des corrélations ou en créant un tableau croisé dynamique dans Excel. Un tableau croisé dynamique vous permet de trier et de filtrer les données selon différentes variables, ainsi que de calculer la moyenne, le maximum, le minimum et l’écart type.

Lorsque vous manipulez des données, il se peut que vous trouviez les données exactes dont vous avez besoin, mais il est plus probable que vous deviez réviser votre question initiale ou collecter davantage de données. Quoi qu’il en soit, en vous y familiarisant, renvoyez-vous à votre question opérationnelle initiale pour que votre analyse demeure sur la bonne voie.

Au cours de cette étape, les outils et logiciels d’analyse de données sont extrêmement utiles. Le logiciel SAS est un outil payant qui est déjà utilisé dans certains ministères, tandis que R et Python sont des logiciels gratuits d’analyse statistique avancée des données. Le logiciel Kaggle est gratuit et ne requiert pas de téléchargement.

Excel nous permet de faire beaucoup de choses. Si vous avez besoin d’une révision ou d’une introduction sur toutes les fonctions d’Excel, consultez cette vidéo sur Youtube : Excel 2016 - Présentation d'Excel 2016. Si vous avez besoin d’outils avancés et que l’équipe des TI rejette votre demande, demandez-leur pourquoi. Une citation utile à retenir, courtoisie de Abe Greenspoon, est:

Montrez-moi la règle.

Étape 5: Interprétez les résultats

Sans contexte, les données ne sont que des chiffres et des lettres. Les mêmes données peuvent avoir des significations différentes selon le contexte commercial.

Au moment de finaliser votre analyse, posez-vous ces questions :

  • Les données répondent-elles à votre question initiale? Comment?
  • Y a-t-il des limites à vos conclusions, des angles que vous n’avez pas considérés?

Présentez vos conclusions aux personnes compétentes de votre organisation. Si votre interprétation des données tient la route après d’autres questions et considérations, vous avez probablement trouvé une solution viable.

À l’époque, les dirigeants d’agences publicitaires proposaient à leurs clients un concept basé sur leur expérience personnelle, leur intuition, leur instinct et une petite étude de marché. Nous vous mettons au défi de trouver une agence qui fonctionne toujours ainsi. Les sentiments ne suffisent pas; l’analyse des données permet de prendre des décisions réfléchies.

Nous devons utiliser les données, nous devons en tirer profit, nous devons faire de notre mieux pour nos citoyens avec les données à notre disposition, mais nous devons protéger la vie privée des gens. Nous devons nous assurer que nous le faisons d’une manière qui ne risque pas de compromettre les renseignements personnels des gens. — Sandy Kyriakatos

Rebecca : Salut, tout le monde, et bienvenue sur le balado Trajetsenbus, je suis votre animatrice Rebecca Nava. Sandy Kyriakatos, la toute première dirigeante principale des données au gouvernement du Canada, compte plus de 20 ans d’expérience en analyse de données. Sandy a été dirigeante principale des données pour Emploi et Développement social Canada pendant trois ans et elle est actuellement dirigeante principale des données à l’Agence des services frontaliers du Canada, ASFC. Nous sommes très enthousiastes à l’idée de parler du rôle de dirigeant principal des données, donc, Sandy, bienvenue à l’émission!

Sandy : Merci de m’avoir invitée, Rebecca.

Rebecca : Tout le plaisir est pour nous. Nous allons commencer par une question facile : qu’est-ce qu’un dirigeant principal des données?

Sandy : C’est une bonne question. Eh bien, je suppose que la réponse la plus courante à cette question est que le dirigeant principal des données ou le bureau du dirigeant principal des données est la partie de l’organisation responsable de la gestion des données ainsi que de la valorisation des actifs de données de l’organisation. Il y a un tas de mécanismes sous-jacents dont je peux parler, qu’il s’agisse de la gestion des données, de la gouvernance ou de l’analyse des données, de l’amélioration de la connaissance des données, et ainsi de suite. En fait, essentiellement, comme le dirigeant principal des RH, qui doit s’assurer que nous prenons soin des gens pour qu’ils puissent nous aider à réaliser notre mandat, le dirigeant principal des données doit s’occuper de nos données pour que nous puissions faire de notre mieux pour nos clients.

Rebecca : D’accord. Je t’avouerais que le mot « données » me semble un peu confus.

Sandy : Moi aussi!

Rebecca : Pour moi, des données peuvent être presque n’importe quoi. S’agit-il de données de courriel, de données Excel. Pourrais-tu me donner un exemple? Quand tu penses à des données, qu’est-ce qui te vient à l’esprit?

Sandy : Je vais te donner deux réponses. Donc, tu as raison, les données sont tout, ce sont tous ces enregistrements dans les bases de données qui, chaque fois qu’on remplit un formulaire, sont saisis par une organisation. Chaque fois que vous recevez un chèque de prestations ou votre salaire, ce sont des données dans un système, mais les données peuvent être sous différentes formes; par exemple, ce que je viens de mentionner est ce que nous appelons des données structurées; vous allez voir des lignes et des colonnes de choses. Oui, cela pourrait être dans Excel, généralement nous parlons de bases de données dans ce cas, mais les données peuvent également être des documents, des images, des vidéos, tout le processus par lequel nous pouvons prendre n’importe quoi et le transformer en données structurées aux fins d’analyse par la suite.

Rebecca : C’est fascinant, je suis heureuse que tu aies mentionné les données structurées parce que décembre est notre mois des données chez Trajetsenbus et que nous écrivons sur les données structurées et non structurées.

Sandy : J’imagine que c’est pour cela que je suis ici.

Rebecca Rebecca : Exactement, et encore merci. Un certain nombre d’emplois de haut fonctionnaire ont fait leur apparition au GC au cours des deux dernières années. Peux-tu nous expliquer la différence entre le dirigeant principal des données, le dirigeant principal du service numérique et le dirigeant principal de l’information?

Sandy : C’est une excellente question. OK, je vais tenter d’y donner une réponse simple. Il y a donc des personnes dont s’occupe un responsable des RH. Le dirigeant principal de l’information, lui, s’occupe de la gestion de nos actifs technologiques, systèmes, ordinateurs, téléphones, ou n’importe quoi d’autre. Le dirigeant principal des données, lui, s’occupe de la gestion et de l’entretien de nos actifs de données, ce qui est très différent. Il est responsable des données. Quant au dirigeant principal du service numérique, son rôle est un peu différent. Je me répète un peu, mais tu sais, le personnel relève des RH, la technologie relève du dirigeant principal de l’information, les données relèvent du dirigeant principal des données, et l’argent relève du dirigeant principal des finances. Il s’agit donc de toutes les composantes que nous devons combiner pour réaliser notre mission. Le dirigeant principal du service numérique, lui, s’intéresse davantage à la façon dont nous donnons à nos clients ou à nos citoyens, à la façon dont nous interagissons avec eux et à la façon dont nous les servons dans ce nouveau monde d’Internet; ce n’est donc pas tant une chose que nous gérons comme les données, les personnes, la technologie et l’argent, mais plutôt le quotidien de nos citoyens, qui ne font pas nécessairement la différence entre le physique et le numérique. Ils ne disent pas « oh, maintenant je vais passer au mode numérique et acheter un livre, et maintenant, je vais passer au mode physique et entrer dans un magasin ». Le dirigeant du service numérique essaie de déterminer comment regrouper toutes ces interactions à l’ère d’Internet.

Rebecca : OK, donc c’est un ensemble.

Sandy : C’est la façon dont nous interagissons, pas ce que nous utilisons pour fournir nos services.

Rebecca : D’accord, merci. En tant que personne visuelle, j’ai l’impression de m’être fait une image dans mon esprit.

Sandy : Il y a beaucoup de confusion autour du poste de dirigeant principal des données. « Est-il plus axé sur la fonction de dirigeant principal, sur les données, sur les deux de façon uniforme? » C’est différent. Les données sont un atout; nous devons les stocker, les saisir, les analyser et les remettre à des personnes pour que ces dernières puissent faire des choses, mais le numérique, c’est s’assurer que nous sommes au courant de la façon dont les gens vivent leur vie aujourd’hui et que nous sommes capables de fournir nos services en ligne.

Rebecca : Très intéressant, merci. Maintenant que nous connaissons la différence, qu’est-ce qui empêche une dirigeante principale des données de dormir la nuit?

Sandy : Eh bien, à part les attentes massives? Les attentes astronomiques? Je vais devoir répondre à cette question en plusieurs parties. Donc, comme tu viens de l’évoquer, les données sont partout, tout le monde doit les utiliser, tout le monde doit s’y mettre, tout le monde doit apprendre; donc la première chose est le défi énorme d’essayer de permettre à chacun dans une organisation de disposer de données. Je pense que le deuxième point important, et c’est certainement un facteur de stress, c’est la dualité du rôle. Nous avons tendance — et nous prenons généralement parti — à protéger les données à tout prix, tandis qu’il y a d’autres personnes qui pensent à les utiliser et à en tirer le meilleur parti à tout prix. Le dirigeant principal des données, le bureau du dirigeant principal des données doit faire les deux en même temps; nous devons utiliser les données, nous devons en tirer de la valeur, nous devons faire de notre mieux pour nos citoyens avec les données dont nous disposons, tout en protégeant la vie privée des gens et en nous assurant que nous le faisons d’une manière qui réduit des risques pour les renseignements personnels des gens. Donc, notre défi consiste un peu à faire deux choses en même temps.

Rebecca : D’accord. Peux-tu nous parler de ces premiers mois en tant que toute première dirigeante principale des données du gouvernement du Canada?

Sandy : C’est une si bonne question, j’ai l’impression de revivre ça en ce moment. Je suppose que ce n’est pas nécessairement lié aux données, mais le premier choc culturel, en quelque sorte, était basé sur le fait que je venais du secteur privé et que je n’avais jamais travaillé pour le gouvernement auparavant. Alors je plaisante sur le fait que je ne parlais pas « gouvernais ». Tout était confus pour moi, rien ne semblait logique. Le simple fait de rédiger une NB, c’est-à-dire une « note de breffage », m’était totalement inconnu. Je me demandais : « Pourquoi fait-on ça? On n’a pas de courriel? » Tu sais, mes premiers mois ont donc été consacrés à mon acclimatation et à mon adaptation à une culture différente, et je ne dis pas différente d’une mauvaise façon, juste différente de celle à laquelle j’étais habituée. J’imagine que l’autre chose que je peux dire, outre le fait que je me suis habituée au changement de culture comme je viens de le mentionner, c’est que je me suis habituée à la différence entre la façon dont le secteur privé utilisait les données et celle dont le gouvernement utilisait ou non les siennes, la distance entre les deux; j’ai vraiment été frappée de voir à quel point le secteur privé était considéré comme équivalent, laissez-moi vous donner un exemple. Beaucoup de nouvelles au sujet de ce qui se passe dans le secteur privé et qui ne devrait pas avoir lieu concernant les données, sachant que rien de tel, même un tant soit peu, n’arrivait au gouvernement, entraînaient une réaction très forte de notre part, et tu sais, même si nous en étions très loin dans notre façon de procéder, cela nous empêchait inutilement de nous servir au mieux de nos données. Il y a donc un véritable fossé entre ces deux secteurs; nous disons les mêmes choses, mais nous faisons des choses vraiment différentes. Il y a donc un grand écart à combler à cet égard.

Rebecca Oui, et je pense que nous en reparlerons un peu plus tard, car j’ai une question à vous poser sur ce qui nous retient en tant que gouvernement. Alors, merci. Je ne veux pas seulement parler travail avec toi, Sandy, parce que tu es une personne merveilleuse. Les gens veulent en savoir plus sur toi tout comme moi. J’aimerais savoir quelle est ta cuisine préférée?

Sandy D’accord, question facile. J’adore la cuisine italienne. Je suis végétarienne, donc c’est un peu délicat parfois. Mais oui, un bon gnocchi avec une sauce à la crème de gorgonzola serait mon choix de dernier souper. Un jour, je serai végétalienne, mais je n’y suis pas encore. C’est exact. J’ai vu ton Twitter. Oui. J’y travaille, j’y travaille, je ne peux pas abandonner cette sauce à la crème.

Rebecca : Végétalienne en herbe. Merci. Revenons à notre sujet. Où se situent les dirigeants principaux des données dans la hiérarchie gouvernementale?

Sandy : Tout comme dans le secteur privé, le poste de dirigeant principal des données n’est pas normalisé. Le niveau du poste dans la hiérarchie peut donc grandement varier. Souvent, au gouvernement ou dans le secteur privé, il peut relever directement de la haute direction ou du sous-ministre, je peux dire ici. Mais souvent, le dirigeant principal des données exercera ses fonctions, et ce, avec grand succès, dans une direction générale de la stratégie ou un service de la stratégie dans le secteur privé, selon moi. Le point clé étant que les données doivent vraiment être basées sur les objectifs opérationnels et être vraiment liées à la stratégie organisationnelle. Pour être honnête, le dirigeant principal des données se trouve à bon nombre d’emplacements divers dans le secteur privé. Parfois dans la sphère du dirigeant principal des finances, parfois dans la sphère du marketing. Mais de façon uniforme, il a souvent tendance à être aussi proche que possible de la stratégie.

Rebecca : OK, c’est bon à savoir. Combien de dirigeants principaux des données avons-nous? Et comment restez-vous joignables?

Sandy : C’est une bonne question. Je ne compte plus le nombre, car il y en a un nouveau tous les mois ou tous les deux mois. Nous avons donc un conseiller en chef des données. Nous nous rencontrons, peut-être une fois par mois, une fois toutes les six semaines environ. C’est donc ça. Alors on se voit souvent. Nous communiquons par courriel tout le temps. Nous sommes peu nombreux et nous avons besoin les uns des autres. Je crois qu’au dernier décompte, il y en avait huit qui portaient le titre de dirigeant principal des données. Mais il y en a d’autres, je dirais qu’il y en a probablement une douzaine qui s’acquittent réellement de cette fonction, mais je pense qu’il y a huit au sein du GC. Alors, c’est plutôt bien. Et le nombre augmente de façon exponentielle. Oui, je me sens beaucoup mieux de ne plus être toute seule.

Rebecca : C’est fantastique. Jusqu’ici. Jusqu’ici. Qu’est-ce qui t’a le plus surprise?

Sandy : Oh, c’est une bonne question. Ce qui m’a le plus surprise. Je suppose qu’en tant qu’employée de la fonction publique, je dois répondre que j’ai été éblouie par les gens. Cela va donc sembler terrible, mais, tu sais, à l’extérieur du gouvernement, il peut parfois y avoir une réputation autour d’un fonctionnaire, une réputation négative.

Et je me retrouve maintenant en train de courir partout et de défendre les fonctionnaires, parce que je suis vraiment, vraiment époustouflée par la profondeur de l’expérience, les compétences que nous avons. Je plaisante en disant qu’il y a tous ces gens qui veulent faire le bien et changer le monde, c’est vraiment… C’est, tu sais, quand je suis entrée dans la fonction publique, en fait, quand je suis entré à DEC au début, je n’étais pas une fonctionnaire. Je suis arrivée par échange de personnel et j’ai changé d’avis parce que, très franchement, le genre de gens que nous avons ici est tout simplement incroyable. Donc ça sonne un peu vieille école. Mais c’est ce qui m’a le plus choquée.

Rebecca : Cela me fait chaud au cœur et je réagis de la même façon. Je défends les miens. Très bien.

Sandy : Chaque fois que quelqu’un commence à parler en mal de la fonction publique, cela m’exaspère. Les gens ne travaillent jamais aussi fort que dans la fonction publique. Oui. Alors, ces gens feraient mieux de se taire.

Rebecca : Exactement. Revenons à la question des données elles-mêmes. Selon toi, quelle est la plus grande idée fausse?

Sandy : Encore une fois, je pense que ma réponse va être un peu élaborée.

Mais je pense que la plus grande idée fausse, c’est qu’il y a ce battage autour des données. Et bien sûr, je travaille dans le domaine des données depuis les années 90, donc, disons que j’ai roulé ma bosse. Mais, tu sais, je pense que les données seules ne feront rien. Je continue de dire que les gens sont le plus grand atout et que les données sont le numéro deux. Donc, le fait d’avoir beaucoup de données, d’avoir des outils, ces choses qu’on appelle maintenant les mégadonnées, est vraiment transformateur, mais seulement quand on y applique l’intelligence humaine jusqu’à ce que quelqu’un utilise, analyse et comprenne ces données. En fait, les données en tant que telles n’apportent aucune valeur. Elles peuvent vous mentir et vous orienter dans la même direction.

Donc, la plus grande idée fausse est que cette automatisation et ces données vont en quelque sorte remplacer la sagesse ou l’intelligence humaine. Et, je pense que c’est très faux. Je pense que c’est l’outil le plus sous-utilisé que les gens doivent utiliser pour exceller par eux-mêmes. Alors, oui, je pense que ces données vont rester là, à moins qu’on n’en fasse quelque chose.

Rebecca : Absolument. Nous devons donc changer ça.

Sandy : C’est un outil. Nous devons l’utiliser.

Rebecca : Oui. C’est fascinant. Je voulais revenir à ce que tu as dit tout à l’heure. Tu as parlé un peu des différences entre le secteur privé et le secteur public et de ce qui nous retient en tant que gouvernement du Canada. Qu’est-ce qui nous empêche d’utiliser nos propres données?

Sandy : Oh, eh ben, on pourrait faire un balado juste sur ce sujet en fonction de mon humeur, on pourrait être assez provocateurs sur cette question.

Je pense que je vais dire le risque et le processus. Rien n’est donc sans risque. Rien de ce que nous faisons dans la vie n’est sans risque. Mais nous avons quelques obstacles, je pense, à comprendre comment prendre des risques raisonnables. C’est ce qui nous retient vraiment. Nous semblons être binaires. Il n’y a pas de risque ou c’est la fin du monde. Nous devons donc vraiment entrer dans cette zone grise et être en mesure de comprendre ce qui est raisonnable, de le réaliser et de l’assumer afin de vraiment tirer parti des données, car il n’y a aucun scénario où l’on peut garantir que tout ira bien. Mais avec la formation, les environnements et les contrôles appropriés en place, le risque est vraiment très faible. Nous devons donc en quelque sorte surmonter cet obstacle pour pouvoir vraiment utiliser les données. Et il ne s’agit pas seulement d’un risque lié aux données, mais aussi d’un risque lié au fait de faire les choses d’une manière différente. Nous avons eu cette conversation récemment à propos de l’utilisation du code source ouvert. Je veux dire, il s’agit là d’un moyen puissant d’amener les spécialistes des données à débloquer la valeur des données de façon vraiment opportune. Et je ne veux pas dire se précipiter et aller vite, mais d’une manière raisonnable. Nous sommes donc très réticents à prendre des risques en ce qui concerne l’utilisation des données. Nous sommes très peu enclins à prendre des risques en utilisant de nouveaux outils comme le code source ouvert. Et ce sera le facteur de succès si nous pouvons surmonter cela. Maintenant, l’autre côté de la médaille, c’est que les mêmes préoccupations subsistent quant au processus.

Une partie de la réduction des risques consiste à faire les choses par petites étapes. Si quelque chose n’est pas clair et que vous faites un petit pas, vous comprenez, vous voyez et vous apprenez de sorte à ne pas subir un énorme désastre découlant d’une petite chose. Mais nos processus sont tous conçus pour faire de grandes, grandes choses. Donc jusqu’à ce que nous nous concentrions sur cette tâche spécifique et que nous cessions de mettre les projets sur le coin du bureau et de demander aux fonctionnaires d’innover pendant leur temps libre… Tant que nous n’aurons pas créé des processus souples qui nous permettront de faire de petits pas, nous ne serons pas en mesure de tirer des données leur véritable valeur. Nous ne pouvons savoir ce que les données nous diront tant que nous n’aurons pas mis la main à la pâte. Le fait d’attendre des années et des années pour mettre en pratique une idée signifie laisser nos occasions s’envoler. Donc, nous devons être capables de prendre des risques et de concevoir des processus appropriés pour des résultats rapides, car l’itération est en quelque sorte la clé pour nous sortir des sables mouvants dans lesquels nous nous trouvons actuellement avec nos données.

Rebecca : Tu sais, c’est vraiment intéressant parce que l’Académie du numérique de l’École de la fonction publique du Canada essaie de fonctionner selon une méthodologie agile, qui se prête un peu plus au prototypage exact maintenant.

Sandy : Mais s’il faut deux ans pour avoir des gens, du matériel ou de l’argent. Adieu la méthode agile.

Rebecca : Oui, exactement. Oui. Il y a donc des contraintes plus importantes à gérer. C’est donc un bon point. Tu l’as mentionné auparavant; j’aimerais parler de la connaissance des données. Quelle est l’importance de la connaissance des données?

Sandy : Je peux dire que c’est probablement la chose la plus importante. Donc, tu sais, je n’essaie pas de vanter l’Académie du numérique ici, je sais que je suis en entrevue, et je ne le dis pas pour cette raison.

Mais j’ai déjà mentionné que l’une des choses qui m’empêchent de dormir la nuit, c’est l’énorme attente découlant de l’impression selon laquelle, maintenant que nous avons le Bureau du dirigeant principal des données, nous allons résoudre tous les problèmes mondiaux liés aux données. Cela n’arrivera que si tout le monde peut utiliser les données. Donc, si nous n’avons que des équipes spécifiques ou un petit groupe de spécialistes des données ou un groupe innovateur en parallèle qui utilise des données, nous aurons certains avantages. Mais nous n’aurons pas d’avantages organisationnels. Nous ne serons pas transformationnels. Nous n’aurons pas de masse critique de valeur jusqu’à ce que presque tout le monde utilise les données. Et ça ne veut pas dire la même chose pour tout le monde. Mais tant que tout le monde ne pourra pas utiliser les outils et les données pour mieux faire son travail, nous ne pourrons pas surmonter cette difficulté, voilà.

C’est pourquoi je dis d’un point de vue prioritaire, tu sais — qu’il s’agisse des cadres supérieurs d’une organisation, d’une personne au téléphone qui traite avec un client ou d’un spécialiste des données qui utilise des techniques de modélisation avancées ou l’apprentissage automatique — tout le monde a besoin d’avoir les bonnes connaissances en matière de données pour son travail afin que nous puissions vraiment tirer profit des données.

Rebecca : Donc, la connaissance des données, ce n’est pas seulement pour quelques-uns, mais pour tous.

Sandy : Tout le monde. Et tu sais, c’est drôle, on a déjà eu ces conversations et j’ai déjà eu des gens qui m’ont dit, tu veux dire vraiment tout le monde, c’est ça? Je veux dire vraiment tout le monde. D’accord. Est-ce que tout le monde sait comment utiliser la technologie? Est-ce que quelqu’un fait son travail aujourd’hui sans savoir comment utiliser un ordinateur portable, sans savoir comment se connecter à un système. Il serait insensé de penser qu’on pourrait avoir des gens qui travaillent dans une organisation qui disent, oh, désolé, je ne sais pas, je ne connais rien à la technologie. Oui. Ça n’a aucun sens. Nous devons atteindre cet objectif en matière de données.

Rebecca : Absolument. Il y a quelque temps, au gouvernement ouvert, on parlait du numérique comme si c’était de l’oxygène. Tu sais, c’est tout autour de nous. C’est omniprésent. Et nous tous, nous travaillons tous avec.

Sandy : Exactement. C’est comme l’autre exemple que j’utilise; est-ce que vous vous attendez à ce que seules les personnes dans une direction générale des communications écrivent? Non, bien sûr que non. Tout le monde écrit. Les Communications disposent un ensemble de compétences spécialisées et ont un besoin très spécifique d’avoir de très bons rédacteurs, mais tout le monde écrit. C’est la même chose avec les données. Oui, il y a des bureaux principaux des données et il y aura des équipes de spécialistes des données pour faire certaines choses bien précises, mais tout le monde a besoin d’utiliser les données.

Rebecca : Bien dit. Pour en revenir à toi, y a-t-il un livre ou un blogue que tu recommanderais à nos auditeurs?

Sandy : J’ai deux choses à dire. Un, je ne lis pas beaucoup de blogues, c’est vraiment mauvais, mais je dois dire, j’obtiens tellement d’information sur Twitter. Je ne peux pas vous expliquer tout ce que je trouve et avec quoi je suis à jour grâce à Twitter et donc c’est juste une chose que je fais et je suis toutes sortes de personnes travaillant dans les données, dans tous les espaces différents. C’est une des choses que je fais pour me tenir au courant. Mais pour ce qui est des livres, je dois dire que je suis obsédée par le livre que je viens de lire, qui s’appelle « Invisible Women », je ne sais pas si vous en avez entendu parler, mais il s’agit de la façon dont notre monde est conçu et le monde des grandes données amplifie en quelque sorte le fait que notre monde est conçu pour certaines catégories de personnes. Et c’est un très bon livre, non pas parce qu’il ne blâme personne, qu’il ne parle pas intentionnellement d’inclure des femmes ou d’autres groupes défavorisés. Mais le monde est fait pour les hommes.

Et on dit qu’il donne de très bons exemples de la façon dont tout est conçu pour certains groupes de personnes, qu’il s’agisse des tests de sécurité de votre voiture ou de la façon dont on déneige en hiver. Ensuite, si nous examinions les données et si nous les concevions en fonction de ce qu’elles nous diraient, nous en tirerions profit pour tout le monde. C’est vraiment un livre très intéressant. Il s’appelle « Invisible Women ». Je ne me souviens plus du nom de l’auteure, mais je pense que c’est une lecture fantastique, tant du point de vue des données que de celui du design et de la société. Et comme je suis aussi une femme dans le domaine des STIM, le moins que je puisse dire c’est que je me sens concernée.

Rebecca : Et nous vous applaudissons. Nous ajouterons le lien vers le livre et votre Twitter avec nos notes de présentation, pour que nous puissions le trouver.

Sandy : Suivre tous les cerveaux de données que je suis.

Rebecca : Oui. Sandy, si je pouvais t’accorder deux vœux, quels seraient-ils?

Sandy : OK. Personnellement, j’aimerais avoir plus de temps. Dans la vie, il n’y a simplement rien de plus précieux que le temps. Donc, tu sais, ce serait la seule chose, si tu pouvais résoudre ce problème pour moi, ce serait génial. Je pense, tu sais, que j’en ai déjà parlé en ce qui concerne mon rôle, nos équipes et ce que nous essayons de faire avec les données. Je pense que si nous pouvions régler ce problème d’accès, si nous pouvions régler ce problème d’accès aux données ou aux outils, bien sûr, d’une manière légitime et prudente, nous devrions toujours tout mettre sous le même toit. Mais je pense que ce serait la clé de toutes les choses qui, tu sais, si nous examinons toutes nos stratégies et nos plans en matière de données, sont pleines de beaucoup de choses, mais si nous ne pouvons pas accéder aux données et aux outils, tout cela sera inutile. Oui, ce serait ça.

Rebecca : Tu as dit qu’une chose que tu souhaiterais, c’est avoir plus de temps. Quand tu auras ce temps, que feras-tu dans ta liste de choses à faire avant de mourir?

Sandy : OK, eh bien, je voyagerais. J’avais une liste de voyage géniale, mais j’ai eu des enfants et ils ont tout gâché. Et je les aime à en mourir, mais bon sang, les voyages sont descendus en bas de ma liste. Cela dit, nous irons au Machu Picchu l’été prochain et les enfants viendront. Alors, ce sera certainement passionnant. Mais, tu sais, honnêtement, voyager est l’une de ces choses. N’importe où où je ne suis pas allé, j’irai.

Rebecca : Oui.

Sandy : Je veux aller partout et n’importe où et pas partout plusieurs fois. Mais honnêtement, n’importe où, je veux aller dans autant d’endroits que possible.

Rebecca : Oui, je suis pareille, je n’aime pas les doubles plongeons au même endroit.

Sandy : Sauf si c’est Paris! J’y suis allée six fois, je dois continuer. Il y a quelques endroits où j’aimerais retourner. Mais, pour moi, c’est surtout « Où va-t-on? Quelle est la prochaine destination? »

Rebecca : Oh, fantastique. Ouais, fantastique. L’avant-dernière question que je te voudrais poser est donc la suivante : les données s’adressent-elles uniquement aux spécialistes des données?

Sandy : Certainement pas! Je vais juste m’arrêter là, comme pour mes enfants. Certainement pas, elles ne s’adressent pas qu’aux spécialistes des données.

Rebecca : Et je pense que tu as expliqué assez clairement pourquoi. Dernière question pour toi, Sandy, quelle est l’une des compétences en matière de données que tu recommanderais à chaque fonctionnaire de posséder?

Sandy: Je pense que la chose la plus importante que chaque personne doit faire est de comprendre comment les données pourraient les aider à mieux faire leur travail. Comment cela peut-il s’appliquer à mon travail? C’est la toute première question, parce que vous pouvez alors obtenir l’aide des gens pour le faire. Il y a beaucoup de gens qui diront : « Oh, non, non, non, les données, ce n’est pas pour moi. Je n’y connais rien. » Et c’est la chose la plus importante à comprendre, savoir que les données pourraient aider tout le monde, que vous soyez au sommet de la pyramide, au niveau des sous-ministres, au téléphone ou ailleurs. Découvrez comment les données peuvent vous aider à mieux faire votre travail.

Rebecca : C’est fantastique. Merci beaucoup, Sandy. Sandy, donc à nos auditeurs, merci. Vous pouvez trouver Sandy dans son endroit préféré.

Sandy : Je ne sais pas si c’est mon endroit préféré, mais c’est un endroit.

Rebecca : Un de ses endroits préférés pour apprendre de nouvelles choses, sur Twitter, nous afficherons son pseudo. Et vous pouvez nous trouver à busrides.ca ou trajetsenbus.ca. Vous pouvez également suivre l’Académie du numérique de l’EFPC sur Twitter et LinkedIn. Alors, venez nous voir sur Trajetsenbus pour en apprendre un peu plus sur la technologie numérique et le gouvernement. Merci encore, Sandy. Et un grand merci à nos auditeurs.

Sandy : Merci de m’avoir invitée.

Ce que nous avons abordé:

  • Les données, c’est l’affaire de tous!
  • Il est possible de tirer profit des données du gouvernement du Canada pour prendre de meilleures décisions.
  • Cinq étapes d’analyse des données que vous pouvez appliquer aux problèmes opérationnels du gouvernement du Canada :
  1. Définissez vos questions
  2. Déterminez ce qu’il faut mesurer et la façon de le faire
  3. Faites la collecte
  4. Menez une analyse
  5. Interprétez les résultats
  • Les données non structurées sont souvent écrites et plus difficiles à organiser.
  • Les données structurées sont souvent disposées en lignes, en colonnes ou dans des bases de données et sont plus faciles à analyser.

Apprenez-en plus sur les données

Notes d’émission du balado


Mandy Hoyt

Public Servant and self proclaimed data geek; putting clients first since 1997. Fonctionnaire et geek de données autoproclamé qui met les clients au premier plan depuis 1997.