Depuis de nombreuses années, depuis une époque où j’avais encore le plaisir de faire de la vraie recherche, je me suis convaincu du fait que la pire des frustrations pour un chercheur, c’est bien moins l’expérience qui échoue ou la théorie brillante qui s’avère fausse, que la réalisation de l’immensité de la littérature publiée sur le sujet de son travail ou sur des sujets connexes. Car c’est aussi la réalisation de l’impossibilité matérielle de prendre connaissance de tout cela, de l’interpréter et d’en tirer profit même si on y passe tout son temps. Ce serait déjà tragique si cette masse d’informations était là une fois pour toutes, mais c’est bien pire: elle évolue et s’agrandit chaque jour.

Certes, on trouve des « trucs », les ordinateurs permettant aujourd’hui des classements thématiques d’articles et nous offrant une logistique incomparable par rapport à ce dont nous disposions il y a seulement quelques années.
Ceci nous a permis d’accéder non plus à 1 % de la littérature qui nous concerne directement, mais à 1,3 % ! (chiffres non vérifiés, bien évidemment, personne ne connaît ces valeurs… Néanmoins, on comprendra le message) ;-)

L’avènement de l’accès libre (Open Access, OA), qu’il soit immédiat, ou qu’il soit retardé de 6 mois ou d’un an, doit avoir augmenté de quelques pourcents notre efficacité à atteindre ce qui nous intéresse. Mais soyons honnêtes, nous sommes toujours loin du compte et nous ne voyons pas comment faire.

Il y a toujours la méthode Coué: persuadons-nous que nous accédons en fait aux meilleurs articles, et ceci devrait nous suffire. Mais ce n’est que la méthode Coué, et chacun sait ce qu’il faut en penser. Elle remonte bien le moral, mais c’est tout. Nous sommes un peu en train de pratiquer la politique de l’autruche face à une avalanche…

En fait, notre salut, au moins partiel, face au submergement, n’est pas de le nier, c’est d’utiliser les technologies disponibles pour multiplier la capacité d’analyse de nos cerveaux. Les informaticiens ont développé le data mining, où mining est utilisé au sens de prospection minière. Il existe aujourd’hui des « robots » capables de faire beaucoup plus que de rechercher des mots ou des phrases dans l’Internet, mais d’en faire une analyse, voire une synthèse, qui ne manque pas d’intérêt pour le problème dont je parle.

A cet égard, une réflexion intéressante a été lancée récemment par le canadien Glen Newton à la conférence « Next Generation Library Interfaces » de la Colorado Association of Research Libraries, qui appelle les éditeurs qui rendent, à quelque moment que ce soit, leur textes disponibles en OA, à utiliser l’OTMI (Open Text Mining Interface, développé par le Nature Publishing Group).
En effet, il y a Open Access et Open Access. C’est fort bien (et c’est un dur combat!) de rendre accessible librement des textes en PDF, mais cela ne les ouvre qu’à la lecture classique et cela n’apporte pas d’aide aussi complète au chercheur qu’une solution permettant le libre accès du texte intégral aux moteurs opérant de la « prospection minière » de textes.

Je suis bien conscient du fait que cette réflexion porte tout particulièrement sur les domaines de la recherche qui comportent une quantité de plus en plus grande d’informations découlant de l’observation ou de l’expérimentation par de nombreux chercheurs. Ce n’est donc pas une règle générale. La lecture intégrale des textes reste, pour diverses disciplines, un passage obligé. Une aide technologique n’est même pas à leur ordre du jour.
Mais pour les autres, ceux qui sont déjà dans l’avalanche, le problème devient crucial.

La solution proposée est-elle réaliste ?
Oui, et elle est déjà démontrée par certains exemples que relève Glen Newton, comme celui d’une équipe chinoise qui a, sans approche expérimentale mais par text mining, découvert dans les données publiées par d’autres chercheurs les chemins biochimiques liés à la dépendance aux drogues (étude publiée en OA dans PLOS Computational Biology). Un article de The Economist marque le coup et conclut: « The old cry “more research is necessary” is not always true. Sometimes all you need to do is look at what you already have in a different way ».