La voix de l’homme

Dès 1993, à l’heure où l’inquiétude écologique commençait à s’imposer dans les débats politiques, Paul Virilio, urbaniste et philosophe, alertait l’opinion sur une forme de pollution moins apparente : la pollution par les technologies. Non pas la pollution sur le monde physique du fait de l’usage des technologies mais « pollution » comme la dégradation des relations de l’humain à sa propre perception de l’environnement. Il percevait les effets sur l’homme de l’usage des technologies, en particulier une altération des capacités d’appréciation de son environnement. La pollution ne porte pas sur les êtres et les choses, mais sur la perception que l’homme en a, et sur l’idée qu’il s’en fait. A travers le titre de son livre de l’époque, « Espace critique », il rappelait que l’usage des technologies correspond à une forme inédite de pollution, car « quelque chose se perd dans l’intervalle qui nécessitait un déplacement pour aller à tel ou tel endroit … tout est à domicile… il n’y a plus de départ et plus d’arrivée ». A la pollution de l’atmosphère s’ajoute la pollution de l’espace lui-même, (« espace » comme autre nom de la relation), une pollution non encore prise en compte. Il la définissait comme « la dégradation de la relation qui vient de l’immédiateté de l’instantanéité des informations » [1].

Un quart de siècle plus tard, où en sommes-nous de cette « pollution » mentale sur le rapport de l’homme à son environnement, à cette altération des capacités cognitives de l’humain par l’effet de ses propres outils technologiques ? Il est plus habituel de parler de « manipulations » ou de « captation de l’attention » que de « pollution » lorsqu’il s’agit de nommer l’influence des technologies sur notre perception du monde - ce dernier terme étant référé aux écosystèmes. Or l’usage de la médiation d’outils technologiques conditionne notre appréhension du monde et peut l’altérer gravement. Visuel et/ou sonore, le champ de notre perception se réduit à des signaux émis par la « machine ».

Il convient ici de rappeler que la spécificité de l’humain est d’être lui-même un écosystème en interaction constante avec son environnement. Sa particularité est d’associer à l’indispensable lumière physique solaire, la lumière psychique des paroles. L’homme vit de paroles. Il en assimile quotidiennement, et en métabolise le sens afin d’élaborer une certaine représentation du sens du monde, des êtres et des choses. A ce titre, la toxicité des aliments, de l’eau ou de l’air serait comparable à la toxicité des paroles dont il se nourrit quotidiennement. Si la « junk food » (malbouffe) altère les fonctions cérébrales, combien plus le flux de propos délirants altèrent la capacité critique d’appréciation du réel.

Les études sur l’usage massifs des écrans s’ajoutent à celle des conséquences psychiques sur la construction des adolescents (une jeune fille sur trois n’est pas satisfaite de son apparence à 14 ans, contre une sur sept à l’âge de 10 ans) [2]. La consommation de contenus numériques explose avec les réseaux sociaux, tandis que le télétravail et les cours à distance ont assigné une large part de la population aux médiations numériques. Ainsi, le temps d’écoute de voix digitales et le temps du vis-à-vis homme-machine s’accroissent imperceptiblement. L’écoute de paroles prononcées directement par une personne humaine se raréfie là aussi imperceptiblement. La pire des pollutions n’est donc probablement pas celle que nous croyons. Elle n’est pas tant celle de l’environnement que celle de l’être humain lui-même, astreint à un environnement technologique dominant, régulant de plus en plus le flux des paroles qu’il assimile.

Or, nous n’avons pas et n’aurons probablement pas les moyens d’apprécier les effets de l’usage, déjà si banalisé, de la « parole-machine » ou reproduction du langage robotisé. C’est-à-dire des voix digitales sollicitant le psychisme humain dans une interaction verbale avec une machine. Il s’est produit incidemment à des fins de confort (ou par les effets du confinement) un détournement de la parole humaine qui n’est plus adressée directement à une autre personne humaine, mais seulement par la médiation de la machine. La présence corporelle de l’interlocuteur a disparu. Il peut nous arriver bien fréquemment de parler à des animaux, voire à des plantes, signe d’une tendresse à l’égard du vivant, plus que d’une attente de réponse puisqu’aucun autre vivant n’est capable d’élaborer un sens. Le sens est spécifiquement destiné à construire l’individu et à être partagé pour l’inscrire dans une relation sociale humaine. Les êtres humains ne communiquent pas seulement leurs humeurs (comme les animaux), ils communiquent pour partager du sens.

A ce titre, si nous ne protégeons pas dès aujourd’hui, l’authenticité des voix humaines et des textes ayant des auteurs humains, nous serons demain engloutis par le déluge de voix et de textes artificiels, qui n’auront plus aucune capacité de nourrir nos intelligences et notre psychisme ! A moins que nous ne soyons soumis à ingérer, le sens prédéterminé par la « parole-machine », que nous appelons aujourd’hui les IA (intelligence artificielle). Plus encore que l’urgence climatique, nous sommes devant l’urgence d’une éthique de l’usage des techniques car elles s’attaquent au besoin humain le plus vital d’un point de vue psychique : la parole. Aussi vrai que l’air et l’eau sont vitales d’un point de vue physique, c’est la préservation de la parole humaine qui est aujourd’hui en jeu. En outre, l’empreinte carbone du numérique reste étrangement dans l’angle mort des radars médiatiques, tel un nouveau tabou du XXIème siècle.
Même les authentiques voix humaines enregistrées sont en passe d’être débordées par les simulateurs vocaux, dont la qualité d’expression sera demain indétectable à l’écoute. Quelle différence faisons-nous entre une machine parlante et une personne parlante ? Au rythme où va le déclassement de l’homme, comment résisterons-nous demain au primat de la parole-machine ? Ainsi survient la question de la présence corporelle de l’interlocuteur. Le corps apparaît alors en lui-même une « parole » que seule une relation – mise en présence - permet d’écouter.
Cette fulgurante irruption des « paroles machines » vient semer une confusion dans l’espace d’émission de paroles. Il s’agit probablement de la pire des pollutions que l’humanité puisse connaître mais nous n’en sommes pas encore réellement conscients. Cette nouvelle pollution par les « voix de synthèses » [3] atteint le psychisme de l’homme et non plus seulement sa biologie physique par les effets du développement. Cette pollution ne détruit pas les écosystèmes, elle devient capable de prendre la main, sur toutes les représentations que l’homme se fait de sa personne et de son environnement.

Terminons en observant deux phénomènes. D’une part la tonalité des commentaires de vrais journalistes s’est fondue dans un ton-machine stéréotypée, imposant un phrasé, un rythme et une tonalité identique pour tout sujet, éliminant toute émotion dans la prononciation [4]. D’autre part avec la pandémie du Covid-19 et le port obligatoire du masque nous avons masqué la source de la parole : la bouche. Dès lors, la parole n’est plus vue comme prononcée mais seulement émise, comme elle le serait d’un appareil radio. Faudra-t-il demain que l’on interdise aux gens de parler à visage découvert ?

[1Le cercle de minuit - émission du 09 mars 1993 - Interview de Paul VIRILIO https://www.youtube.com/watch?v=KNwYcRzzk4U

[4Comment obtenir une voix ou un son typé « radio » dans vos live streaming Twitch OBS ?
https://korben.info/qualite-voix-obs-son-radio.html
Pourquoi les voix off des reportages parlent-elles toujours de la même façon ?
https://www.madmoizelle.com/voix-reportage-tele-755449

Partager cet article