Nous devons reconnaître que beaucoup de données scientifiques proviennent d'équipes et non d'individus

Nous devons reconnaître que beaucoup de données scientifiques proviennent d'équipes et non d'individus
 

<div _ngcontent-c14 = "" innerhtml = "
Getty

La société aime les héros. Malheureusement, les équipes peuvent rarement être des héros. Des histoires complexes de découvertes et d'innovation impliquant des centaines de collaborateurs travaillant ensemble sont finalement Cela se résume de mieux en mieux dans le monde de la science des données, où les équipes interdisciplinaires collaboratives sont la norme, mais les éloges et l'adulation sont typiquement

La science a longtemps été perçue comme le travail de la science des données comme un travail d'équipe.

La masse des individus choisis arbitrairement par la presse et des personnalités extérieures pour représenter ces équipes. des génies solitaires travaillant dans la solitude, travaillant sans relâche à la résolution d'un problème, jusqu'à ce qu'une poussée d'inspiration surmonte les obstacles qui se dressent devant eux et mène à une percée Cela change le cours même de l’humanité. Tel est le récit de type Disney qui guide la façon dont nous voyons le processus scientifique qui a à son tour influencé la manière dont la presse et les médias sociaux de plus en plus décrivent l’innovation scientifique et technologique.

Alors que la science des données a infusé dans presque tous les domaines imaginables, les travaux de Les programmeurs, les analystes, les spécialistes de la visualisation et de nombreuses autres disciplines se réunissent pour former des équipes modernes de science des données qui s'attaquent aux grands défis de la société. Plutôt que de reconnaître les contributions de toutes ces personnes en tant qu’équipe soudée dans laquelle le succès doit ses efforts à tous, nous décrivons toujours la science des données en termes de chercheur solitaire de données en train de picorer un ordinateur portable en résolvant les défis du monde par eux-mêmes.

 

Les découvertes scientifiques sur les données qui attirent l'attention des médias rejettent généralement cette idée de collaboration et la remplacent par un ou deux individus qui deviennent les "héros" d'une innovation qui était en réalité le travail de centaines de personnes.

Les startups, les ONG ou les chercheurs open source dotés de ressources peuvent très bien être un groupe de science des données, même s'ils s'appuient généralement sur un vaste paysage de jeux de données et d'algorithmes ouverts et commerciaux pour mener leurs analyses. Comme pour les grands groupes de science des données, ces ensembles de données et outils sont rarement reconnus.

Ceci peut malheureusement être particulièrement préjudiciable aux membres des groupes sous-représentés ou dont les contributions ont été centrées sur l'infrastructure plutôt que sur des zones exposées au public telles que la visualisation. Les administrateurs système qui ont fait vibrer le centre de données ou les architectes qui ont écrit les algorithmes de simulation sur lesquels le projet reposait retiennent rarement l'attention de ceux qui ont conçu les superbes visualisations scientifiques qui sont devenues le visage du projet ou qui ont contextualisé les résultats pour publication.

Les équipes de science des données créent rarement toutes leurs données, écrivent tous leurs algorithmes et codent l'intégralité de leur flux de travail. Les ensembles de données, les algorithmes, le code et les outils proviennent d'une multitude d'endroits, mais rares sont ceux qui méritent une note de bas de page dans la section des remerciements de l'article ou du communiqué de presse final, sans parler d'une mention dans le texte même de l'article.

Dans certains cas, il s'agit pour conserver un avantage concurrentiel dans la mesure où une application particulièrement réussie d'un algorithme du commerce peut ne pas vouloir informer les concurrents sur l'outil utilisé ou sa configuration.

Dans la plupart des cas, il s'agit simplement Les chercheurs dans les disciplines des données sont de plus en plus issus de programmes d'études qui n'insistent pas sur la notion de crédit et de reconnaissance.

Alors que les jeunes historiens insistent sans cesse sur l'importance cruciale de rappeler chaque fait qu'ils renvoient à sa source première, les informaticiens restent rarement enseigné l'art de la citation.

En fait, l'essor de vastes référentiels de code ouvert tels que Stack Overflow et GitHub a conduit les nouvelles générations de codeurs à le comportement opposé est précisément le suivant: copier et coller des fragments de code sans se soucier d’où ils viennent ni qui les a écrits et certainement sans se soucier d’accorder aucune reconnaissance aux auteurs originaux.

Non seulement une telle action prive les auteurs de ces auteurs. ensembles de données, algorithmes et logiciels de crédit, ce manque de reconnaissance complique également grandement le processus de réplication .

En somme, les progrès scientifiques ont longtemps amené les dirigeants et les agents de liaison à jouer leur rôle public, mais nous devons fait mieux pour reconnaître toutes les personnes sous leur ombre et le nombre incroyable de contributions collaboratives qui alimentent les découvertes actuelles basées sur les données. En fin de compte, en aidant la presse et le public à mieux comprendre le fonctionnement de la science des données et la collaboration qui la sous-tend généralement, nous pouvons aider à mieux raconter l’histoire de l’innovation et faire en sorte que la contribution de chacun soit reconnue. [>

">

La société aime les héros. Malheureusement, les équipes peuvent rarement être des héros. Des histoires complexes de découvertes et d’innovations impliquant des équipes de centaines de collaborateurs travaillant ensemble sont finalement résumées en une ou deux figures de proue qui deviennent le visage public et les «héros» responsables du succès de l’équipe. Cela est devenu de plus en plus vrai dans le monde de la science des données, dans lequel les équipes interdisciplinaires collaboratives sont la norme, mais les éloges et l'adulation sont généralement concentrés sur des individus isolés arbitrairement choisis par la presse et par un public extérieur pour les représenter.

La science a longtemps été perçue comme le travail de génies solitaires travaillant dans la solitude, travaillant sans relâche à la résolution d'un problème, jusqu'à en devenir une source d'inspiration. surmonte les obstacles qui les attendent et débouche sur une découverte décisive qui modifie le cours même de l’humanité. Tel est le récit de type Disney qui guide la façon dont nous voyons le processus scientifique qui a à son tour influencé la manière dont la presse et les médias sociaux de plus en plus décrivent l’innovation scientifique et technologique.

Alors que la science des données a infusé dans presque tous les domaines imaginables, les travaux de Les programmeurs, les analystes, les spécialistes de la visualisation et de nombreuses autres disciplines se réunissent pour former des équipes modernes de science des données qui s'attaquent aux grands défis de la société. Plutôt que de reconnaître les contributions de toutes ces personnes en tant qu'équipe soudée dans laquelle le succès repose sur les efforts de chacun, nous décrivons toujours la science des données en termes de chercheur solitaire de données en train de picorer un ordinateur portable en résolvant les défis du monde par eux-mêmes.

Data Les découvertes scientifiques qui attirent l'attention des médias rejettent généralement cette idée de collaboration et la remplacent par un ou deux individus qui deviennent les «héros» d'une innovation qui était en réalité le travail de centaines de personnes.

Tandis que la startup à faibles ressources, l'ONG ou un chercheur open source pourrait très bien être un groupe de science des données, même s'ils s'appuient généralement sur un vaste paysage d'ensembles de données et d'algorithmes ouverts et commerciaux pour effectuer leurs analyses. Comme pour les grands groupes de science des données, ces ensembles de données et outils sont rarement reconnus.

Ceci peut malheureusement être particulièrement préjudiciable aux membres des groupes sous-représentés ou dont les contributions ont été concentrées sur l'infrastructure plutôt que sur des zones exposées au public telles que la visualisation. Les administrateurs système qui ont fait vibrer le centre de données ou les architectes qui ont écrit les algorithmes de simulation sur lesquels le projet reposait retiennent rarement l'attention de ceux qui ont conçu les superbes visualisations scientifiques qui sont devenues le visage du projet ou qui ont contextualisé les résultats pour publication.

Les équipes de science des données créent rarement toutes leurs données, écrivent tous leurs algorithmes et codent l'intégralité de leur flux de travail. Les ensembles de données, les algorithmes, le code et les outils proviennent d'une multitude d'endroits, mais rares sont ceux qui méritent une note de bas de page dans la section des remerciements de l'article ou du communiqué de presse final, sans parler d'une mention dans le texte même de l'article.

Dans certains cas, il s'agit pour conserver un avantage concurrentiel dans la mesure où une application particulièrement réussie d'un algorithme du commerce peut ne pas vouloir informer les concurrents sur l'outil utilisé ou sa configuration.

Dans la plupart des cas, il s'agit simplement Les chercheurs dans les disciplines des données sont de plus en plus issus de programmes d'études qui n'insistent pas sur la notion de crédit et de reconnaissance.

Alors que les jeunes historiens insistent sans cesse sur l'importance cruciale de rappeler chaque fait qu'ils renvoient à sa source première, les informaticiens restent rarement enseigné l'art de la citation.

En fait, l'essor de vastes référentiels de code ouvert tels que Stack Overflow et GitHub a conduit les nouvelles générations de codeurs à le comportement opposé est précisément le suivant: copier et coller des fragments de code sans se soucier d’où ils viennent ni qui les a écrits et certainement sans se soucier d’accorder aucune reconnaissance aux auteurs originaux.

Non seulement une telle action prive les auteurs de ces auteurs. ensembles de données, algorithmes et logiciels de crédit, ce manque de reconnaissance complique également grandement le processus de réplication .

En somme, les progrès scientifiques ont longtemps amené les dirigeants et les agents de liaison à jouer leur rôle public, mais nous devons fait mieux pour reconnaître toutes les personnes sous leur ombre et le nombre incroyable de contributions collaboratives qui alimentent les découvertes actuelles basées sur les données. En fin de compte, en aidant la presse et le public à mieux comprendre le fonctionnement de la science des données et la collaboration qui la sous-tend généralement, nous pouvons aider à mieux raconter l’histoire de l’innovation et faire en sorte que la contribution de chacun soit reconnue.