Le premier danger c’est l’effet boîte noire car effectivement on met dans ces machines, deux type de fonctionnement : le machine Learning qui est un niveau primaire ou on apprend à une machine à reconnaître des formes ou a effectuer une tâche. Cette machine va apprendre progressivement puis modifier au fur et mesure de l’expérience son comportement. Ce sont en fait des fonctions assez basiques qui sont utilisées dans la reconnaissance de formes primaires. Ensuite, il y a une étape supplémentaire qui est celle du deep Learning ou apprentissage profond. Le système est ici beaucoup plus complexe étant donné qu’il s’agit d’associer plusieurs ordinateurs dans un système ressemblant aux réseaux neuronaux et la machine apprend et évolue dans le même temps. Cependant il est clair que la machine n’est pas capable de penser ni de s’exprimer et on ne sait pas exactement comment évolue le logiciel. Il est donc important de suivre cette évolution en temps réel et donc d’en faire le monitoring. Cependant des biais peuvent survenir. Soit involontaire et survenant lors la conception même du système ou de l’algorithme ou secondairement si l’on imagine une manipulation de ces logiciels qui soit peu ou pas détectable par l’utilisateur et qui aboutisse à des biais de fonctionnement très important. L’autre risque concerne l’utilisation des données. Pour tourner tous ces logiciels ont besoin de données. Elles sont bien sûr multiples mais en ce qui nous concerne il s’agit de données d’imagerie et ce qui intéresse aussi c’est l’association aux données cliniques et paracliniques biologiques mais aussi génétiques. Ces bases de données proviennent de notre activité quotidienne et cela pose le problème de la confidentialité de ces données et aussi de la relation fiduciaire que nous avons avec nos patients qui repose sur la confidentialité. C’est donc quelque chose de potentiellement très important. Le corollaire c’est que ces données ont aussi une valeur commerciale et il ne faut donc pas les abandonner. Les entreprise qui développent ces outils logiciels vont un jour les vendre et si l’on donne ces données sans contre partie nous seront amené à repayer des logiciels pour pouvoir les utiliser.
The first danger is what is called the black box effect. Actually we put in these machines, two types of process: the Learning machine which is a primary level where we teach a machine to recognize forms or to perform a task. This machine will learn gradually and update gradually with the experience of its behavior. This process is actually pretty basic and is used in the recognition of primary forms. Then there is an extra step, which is deep learning. The system is much more complex because it involves several computers associate together in a neural networks association model. The machine learns and evolves at the same time. However it is clear that the machine is not able to think or express itself and we do not know exactly how the software evolves. It is therefore important to follow this evolution in real time and thus to monitor it. However, biases can occur. It can be unintentional and occurring during the system design or secondarily if one imagines a manipulation of the algorithm that is little or not detectable by the user and that could leads to very important operating bias. The other risk is the use of the data. To be functional all these software need data. They are of course multiple type but in our case, it is about imaging data and what is also interesting is the association with clinical and biological data but also genetic. These databases come from our day-to-day business and this raises the issue of the confidentiality of this data and also the fiduciary relationship we have with our patients. This relationship is based on confidentiality. So it’s potentially very important. The corollary is that these data also have commercial value and should not be abandoned. Companies that develop these software tools will someday sell them and if we give these data without compensation we will have to pay back software to use them.