Whisper on the line

Testing transcription with OpenAI Whisper models

By Nicolas Gambardella

Artificial Intelligence is on the front page of all newspapers those days (often for the wrong reasons…). Of course, AI is not new, the field dating from the middle of last century; neither are cascading neural networks, which I used in the 1990s to predict protein’s secondary structures. However, it really exploded with Deep Learning. Some stories made the news over the years, for instance, DeepMind’s AlphaGo beating a Go’s world champion and AlphaFold solving the long-standing problem of predicting protein’s 3D structures (well, at least the non-flexible conserved parts…). Still, most successes remained confined to their respective domains (e.g., environment recognition for autonomous vehicles, tumour identification and machine translation such as Google Translate and DeepL). However, what brought AI to everyone’s attention was OpenAI’s DALL’E and, more recently, ChatGPT, which can generate images and text following a textual prompt.

OpenAI actually developed many other Deep Learning models, some open source. Among those, Whisper models promise to be a real improvement in speech recognition and transcription. Therefore, I decided to test Whisper on two different tasks: a scientific presentation containing technical terminology, given by a US speaker, and a song containing cultural references, sung by an American singer but with no accent (i.e., BBC-like…).

More details on OpenAI whisper can be found on Github and in the scientific publication.

Setup

Lenovo Thinkpad T470 I, no GPU.
Linux Ubuntu 22.10
Python 3.10.7
Pytorch 2.0
I used the model for speech recognition in the video editing tool
Kdenlive 23.04
(Update 31 May 2023: I was able to run Whisper on Linux Ubuntu 23.04 with Python 3.11.2 and Kdenlive 23.04.1 ; although installing all the bits and pieces was not easy)

Whisper can be used locally or through an API via Python or R (for instance with the package openai), although a subscription might be needed if you already used all your free tokens.

There are five Whisper models.

ModelsParametersRequired VRAMRelative speed
Tiny39 M~1 GB~32x
Base74 M~1 GB~16x
Small244 M~2 GB~6x
Medium769 M~5 GB~2x
Large1550 M~10 GB1x

Note that these models run perfectly well on CPUs. While GPUs are necessary for training Deep Learning models, this is not the case when using them (although running them on CPU will always be slower because of floating point computations).

As an external “control”, I used the VOSK model vosk-model-en-us-0.22 (just called VOSK in the rest of this text).

NB: this is an anecdotal account of my experience, and does not replace comprehensive and systematic tests, for instance, using datasets such as Tedlium. or LibriSpeech test-clean

I used speech recognition to create subtitles, as it represents the final aim in 95% of my professional transcriptions. Many videos are available to explain how to generate subtitles in Kdenlive, including with Whisper.

Transcription of a scientific presentation

The first thing I observed was the split into text fragments. I noticed that their placement along the timeline (the timecodes) was systematically off, starting and finishing too early. Since this did not depend on the model, the problem could come from Kdenlive.

The length of the text fragments varied widely. VOSK produced small fragments, perfect for subtitles, but cut anywhere. Indeed, VOSK does not introduce punctuation and has no notion of sentence. The best fragments were provided by Tiny and Large. They were small, perfect for subtitles, and cut at the right places. On the contrary, Small produced fragments of consistent lengths, longer than Tiny and Large, and thus too long for subtitles, while the fragments produced by Base and Medium were very heterogeneous, only cut after periods.

The models differed straight from the beginning. Tiny produced text that was much worse than VOSK (if we ignore the absence of punctuation by the latter). “professor at pathology” instead of “of pathology”, a missing “and”, a period replaced by a comma, and a quite funny “point of care testing” transformed into “point of fear testing”! All the other models produced perfect texts, Small, Medium, and Large even adhering to my beloved Oxford comma.

VOSK: welcome today i'm john smith i'm a professor of pathology microbiology and immunology and medical director of clinical chemistry and point of care testing
Tiny: Welcome today, I'm John Smith. I'm a professor at Pathology, Microbiology, Immunology, and Medical Director of Clinical Chemistry and Point of Fear Testing.
Base: Welcome today. I'm John Smith. I'm a professor of pathology, microbiology and immunology and medical director of clinical chemistry and point of care testing.
Small: Welcome today. I'm John Smith. I'm a professor of pathology, microbiology, and immunology, and medical director of clinical chemistry and point of care testing.
Medium: Welcome today. I'm John Smith. I'm a professor of pathology, microbiology, and immunology and medical director of clinical chemistry and point of care testing.
Large: Welcome today. I’m John Smith. I'm a professor of pathology, microbiology, and immunology, and medical director of clinical chemistry and point of care testing.

A bit further, the speaker described blood gas analysers. VOSK can only analyse speech using dictionaries. As such, it could not guess that pH, pCO2, and pO2 represent acidity, partial pressure of carbon dioxide and partial pressure of oxygen, respectively and spell them correctly. It also missed the p in pCO2. The result is still understandable for a specialist but would give odd subtitles.. The Whisper models consider the whole context, and can thus infer the correct meaning of the words. Tiny did not understand pH and pCO2, merging them. All the other models produced perfect texts.

VOSK: [...] instruments came out for p h p c o two and p o two
Tiny: [...] instruments came out for PHPCO2 and PO2.
Base: [...] instruments came out for pH, PCO2 and PO2
Small: [...] instruments came out for PH, PCO2, and PO2.
Medium: [...] instruments came out for pH, PCO2, and PO2.
Large: [...] instruments came out for pH, PCO2, and PO2.

VOSK’s dictionaries sometimes gave it an edge. For instance, it knew that co oximetry was a thing, albeit missing a dash. Only Large got it right here, Base, and Medium hearing coaximetry, and Tiny even hearing co-acemetery!

VOSK: [...] we saw co oximetry system
Tiny: [...] we saw co-acemetery systems.
Base: [...] we saw coaximetry systems.
Small: [...] we saw coaxymetry systems.
Medium: [...] we saw coaximetry systems.
Large: [...] we saw co-oxymetry systems.

Another example is the name of chemicals. VOSK recognised benzalkonium, which was recognised only by Medium. Interestingly, the worst performers were Base, which misheard benzylconium, and Large, which misheard benzoalconium (Tiny and Small heard properly but spelt the word wrong, with a ‘c’ instead of a ‘k’).

The way Whisper Large can understand mispronounced words is very impressive. In the following example, Small and Large are the only models correctly recognising that there are two separate sentences. More importantly, VOSK and Tiny could not identify the word “micro-clots”. The hyphenation is a matter of discussion. While the parsimonious rule should apply (do not use hyphens except when not doing so would generate pronunciation errors), using hyphens after micro and macro are commonplace.

VOSK: [...] to correct the problem like micro plots and and i discussed the injection of a clot busting solution
Tiny: […] to correct the proper microplasks. And I discussed the injection of a clock-busting solution.
Base: […] to correct the problem like microclots and I discussed the injection of a clot busting solution.  (wrong start)
Small: […] to correct the problem, like microclots. And I discussed the injection of a clot-busting solution.
Medium: […] to correct the problem, like microclots, and I discussed the injection of a (wrong start, missed end of sentence.)
Large: […] to correct the problem, like micro-clots. And I discussed the injection of a clot-busting solution.

In conclusion, Whisper Large is the best model, not surprisingly, with the surprising exception of the small mistake on “benzalkonium”.

Transcription of a pop culture song

Adding sound on top of speech, such as music, can throw off speech recognition systems. Therefore, I decided to test the models on a song. I chose a very simple song with slow and clearly enunciated lyrics. And frankly, being a nerd, I relished highlighting those fantastic Wizard Rock scene artists whose dozen groups have been celebrating the Harry Potter universe through hundreds of great songs. I used a song from Tonks and the Aurors entitled “what does it means”.

The first massive observation was that I could not compare VOSK to Whisper models. Indeed, the former is absolutely unable to recognise anything. The “transcription” was made of 27 small fragments of complete gibberish, with barely a few correct words. Only one fragment contained an actual piece of the lyrics: “Everybody says that it’s probably nothing”. However, these words were also identified by all Whisper models.

Now for the Whisper models. The overall recognition was remarkable. On the front of fragment size, only Tiny produced small fragments, perfect for subtitles, cut at the right places. Medium was not too bad. Base and Small produced heterogeneous fragments, only cut after periods. Large produced super short segments, often made up of one word. Initially, I thought this was very bad. However, I then realised that it was perfect for subtitling the song; just the right rate in character per second, very readable.

Something odd happened at the start, with some models adding fragments while there was no speech, such as “Add text” (Tiny) or “Music” (Base). Large added the Unicode character “♪” whenever they were music and no speech, which I found nice.

When it came to recognise characters from Harry Potter, the models performed very differently. Tiny and Base did not recognise Mad-Eye Moody. And they also failed to distinguish between Mad-Eye and Molly (Weasley). They also made several other mistakes, e.g. “say” instead of “stay”. Tiny even mistook “vigilant” for “vigilance” and completely ignored the word “here”. It also interpreted “sympathy” in the rather bizarre, “said, but me”!

Tiny: Dear, Maddie, I'm trying to say constantly vigilance
Base: Dear, Madhy, I'm trying to say, Constantly vigilant Here, 
Small: Dear Mad Eye, I'm trying to stay constantly vigilant Here, 
Medium: Dear Mad-Eye, I'm trying to stay constantly vigilant here
Large: Dear mad eye I'm trying to stay constantly vigilant Here
Tiny: Dear, Maddie, thanks a lot for your tea and said, but me
Base: Dear, Madhy, thanks a lot for your tea and sympathy
Small: Oh, dear Molly, thanks a lot for your tea and sympathy (“Oh” should be on a segment of its own)
Medium: Oh, dear Molly, thanks a lot for your tea and sympathy (“Oh” should be on a segment of its own)
Large: Dear Molly Thanks a lot for your tea and sympathy

Another example of context-specific knowledge is the Patronus. Note that such a concept is absolutely out of reach for models using dictionaries. Only machine learning models trained with Harry Potter material can work it out. And this is the case for Medium and Large. Small is not so far, while Tiny and Base try to fit the sounds into a common word.

Tiny: But I can't stop thinking about my patrolness 
Base: but I can't stop thinking about my patrolness
Small: Here, but I can't stop thinking about my Patronas
Medium: But I can't stop thinking about my Patronus
Large: But I Can't stop Thinking about My Patronus

Tiny and Base also made several other errors, mistaking “phase” for “face”, or “starlight” for “start light”.

Interestingly, Tiny hallucinated 40 seconds of “Oh, oh, oh, oh” at the end of the the song, while Base, Small, and Medium hallucinated a “Thank you for watching”.

Conclusion

While Medium provided an overall slightly better text, Large provided the best subtitles for the song, without hallucinations.

Overall, for both task Open AI Whisper Large provided an excellent job, surpassing many human transcriptions I had to deal with, in particular when it comes to technical and non-standard terms.

Quelques faux-amis peu connus

Par Nicolas Gambardella

Tout le monde connaît les faux-amis anglais-français comme actually et actuellement, le second signifiant « maintenant » tandis que le premier signifie « en réalité ». Mais certains faux-amis sont plus rares ou plus subtils. En voici quelques-uns auxquels un traducteur doit faire attention. Je mettrai cette liste à jour au fur et à mesure que j’en rencontrerai de nouveaux.

Agenda et agenda

En français un agenda est un petit livre contenants des pages correspondant à chaque jour, destiné à enregistrer les activités et rendez-vous à venir. La traduction anglaise est diary. En anglais, un agenda est soit une liste de chose à faire (ce que l’on écrirait dans un agenda français), c’est-à-dire un ordre du jour, soit un but caché.

Bigot et bigot

En français, un bigot ou une bigote sont des croyants pratiquants à l’extrême, des « grenouilles de bénitier ». En anglais, le terme n’est pas limité à la religion. A bigot est une personne extrêmement attachée à une idée, et ayant des préjugé ou même une attitude agressive envers toute personne ne partageant pas cette croyance.

Mettre les points sur les i et dotting the i’s

En français, mettre les points sur les i signifie être clair avec quelqu’un qui ne veut pas comprendre. Une expression très proche (que l’on utilisera toutefois dans un contexte légèrement différent) est remettre les pendules à l’heure. Une traduction en anglais serait to set the record straight. En revanche l’expression anglaise dotting the i’s signifie clarifier tous les détails, fignoler un travail. On l’utilise souvent dans l’expression plus longue dotting the i’s and crossing the t’s.

Adresser et to address

Tout comme le verbe anglais to address, le verbe français adresser possède un grand nombre d’acceptions dont certaines sont partagées. « To address a letter » signifie « adresser une lettre ». « To address someone » signifie « s’adresser à quelqu’un » Cependant, l’un comme l’autre présente des significations qui lui sont propres. Attention donc aux faux-amis. « to address a problem or a question » se traduit par « s’occuper d’un problème » ou « répondre à une question ». Pour répondre à des questions métaphysiques, on peut « s’adresser à la philosophie », qui en anglais se traduira pas « to turn to phylosophy ».

Déception et deception

En anglais, une deception est un mensonge, une tromperie, une action visant à induire quelqu’un en erreur. Cette signification a disparu en français, où une déception est le sentiment la tristesse ressentit lorsqu’un espoir n’est pas rempli. La traduction anglaise de déception est disappointment.

Accord et accord

Dans le cadre d’un traitement, un le français accord correspond à l’anglais assent (donner son accord). En anglais, un accord est une adhésion thérapeutique, une convergence de vue avec la personne prescrivant le traitement (les opinions sont en accord).

Cave et cave

En français, la cave est une pièce en sous-sol, par exemple pour conserver le vin, et se traduit par cellar en anglais. En anglais, a cave est un trou dans un relief rocheux, traduit par caverne ou grotte en français.

Mental et mental

En anatomie, l’adjectif anglais mental se réfère au menton (du latin mentum), comme dans « mental foramen ». En français, l’adjectif correct est mentonnier, mental faisant référence au latin mens, l’esprit.

Crâne et crane

En anglais, crane signifie grue, que ce soit l’oiseau ou la machine. Le français, crâne se traduit par l’anglais skull.

Lunatique et lunatic

En anglais, une personne lunatic est un·e fo·u·olle (loony), tandis qu’en français un lunatique est quelqu’un qui change d’opinion sur un coup de tête.

Dramatique et dramatic

En anglais, dramatic peut signifier « soudain et frappant » et avoir une connotation positive (par exemple, « a dramatic increase of cancer remissions »). L’utilisation du français dramatique ici impliquerait une tragédie avec des conséquences très négatives. La traduction française correcte est spectaculaire, « une augmentation spectaculaire des rémissions de cancer ».

Diaphorétique et diaphoretic

Assez technique et subtil, mais sémantiquement et médicalement important. L’adjectif français diaphorétique signifie uniquement « qui fait transpirer », tandis que l’adjectif anglais diaphoretic signifie également « transpirer excessivement », tant pour une personne que pour une peau.

Adhésion (thérapeutique) et (medical) adherence

En anglais, l’adherence d’un patient est le respect scrupuleux d’un traitement, y compris la posologie des médicaments, le calendrier d’administration et toute autre mesure prescrite. Elle est traduite par le français observance. Alors qu’en français, l’adhésion thérapeutique correspond à l’anglais concordance lorsque le patient est d’accord avec le choix fait et les décisions prises par le personnel de santé, et qu’il devient un participant actif de son traitement. Notez qu’en français, adhésion et adhérence sont utilisées dans des contextes différents.

Affecter et to affect

L’anglais to affect, qui signifie avoir un effet sur quelque chose, est (devrait être) traduit par influer sur. Le français affecter signifie adopter, prétendre si l’on parle de l’attitude d’une personne, et présenter si l’on parle des caractéristiques d’une chose.

Fastidieux et fastidious

En français, fastidieux présente une connotation négative, décrivant quelque chose de répétitif et d’ennuyeux. La traduction anglaise est tedious. Au contraire, en anglais, fastidious peut avoir une connotation positive, décrivant quelqu’un qui se soucie de la précision et des détails, correspondant au français pointilleux.

Légume et legume

En anglais, un legume est une plante (ou son fruit) appartenant à la famille des Leguminosae, comme les haricots, les pois, les cacahuètes ou les lentilles. La traduction française est légumineuse. En français, un légume est toute plante potagère cultivée pour l’alimentation, correspondant à l’anglais vegetable. En français, un végétal est toute plante, champignon ou algue.

Vocable et vocable

En anglais, un vocable est un énoncé non verbal, tel que « la la la », « Huh », etc. À l’opposé, en français, un vocable est un mot ou une expression dont la sémantique est très précise, parfois contextuelle.

Employé et employee

En anglais, un employee est une personne payée par une autre pour fournir un travail. En français, les employés forment une catégorie de travailleurs dont le travail n’est pas manuel, mais qui n’occupent pas une position de cadre. La traduction française correcte d’employee est salarié.

Idiome et idiom

En français, idiome signifie dialecte. En anglais, un idiom est une expression dont le sens est figuratif. La traduction française d’idiom est idiotisme. En anglais, l’idiotism est la condition rendant idiot.

Criquet et cricket

La traduction française de l’anglais cricket est grillon. Le criquet français est traduit en anglais par grasshopper. En fait, les Français ont volé le nom anglais pour nommer par erreur tous les insectes du sous-ordre Caelifera. Ceux-ci sont divisés en locustes s’ils peuvent former des populations migrantes et en sauteriaux s’ils ne le peuvent pas. Là, où cela devient amusant, c’est que locuste est le latin pour sauterelle. Par conséquent, les criquets français sont divisés en sauteriaux et en sauterelles !

Pétulant et petulant

Petulant en anglais et pétulant en français ont des significations légèrement différentes. L’ancienne dirigeante des libéraux démocrates, Jo Swinson, a été traitée de petulant par un député travailliste. Il voulait dire par là qu’elle avait mauvais caractère, était boudeuse. En français, pétulante signifie dynamique, plein d’énergie, ce qu’était aussi Jo Swinson… peut-être un peu trop.

Some lesser-known false friends

By Nicolas Gambardella

Everyone knows English-French “false friends” such as actually and actuellement, the second meaning “currently” while the first means “in reality”. But some false friends are rarer or subtler. Below are a few of them that a translator should worry about. I will update the list as I come across new ones.

Agenda versus agenda

In English, an agenda is either a list of things to be discussed or done, an ordre du jour in French, or a hidden plan. While in French, an agenda is the physical support on which to write down the things to be discussed or done, i.e., a diary.

Bigot versus bigot

In English, a bigot is a person extremely attached to an idea, and prejudice or even antagonistic with anyone who is not sharing this belief. In France, the term is reserved for religion, un bigot or une bigote being religious believers whose practice is extreme.

Dotting the i’s versus mettre les points sur les i

In English, dotting the i’s means to finish something to perfection. It is often used as part of dotting the i’s and crossing the t’s. The French translation would be fignoler [un travail]. However, the French expression mettre les points sur les i means to be very clear with someone who is reluctant to understand. An English translation would be to set the record straight.

To address versus adresser

Like the English verb to address, the French verb adresser has many meanings, some of which are shared. “To address a letter” means “adresser une lettre”. “To address someone” means “s’adresser à quelque’un”. However, both also present specific meanings. So beware of false friends. “To address a problem or a question” is translated into “s’occuper d’un problème” or “répondre à une question”. To answer metaphysical questions, one can, in French, “s’adresser à la philosophie”, which in English is translated as “to turn to phylosophy”.

Deception versus déception

In English, a “deception” is a lie, a sham, an action aimed at misleading someone. This meaning has disappeared in French, where a “déception” is the feeling of sadness felt when a hope is not fulfilled. The English translation of “déception” is “disappointment”.

Accord versus accord

In the context of treatment, an accord in French is an assent in English (to give one’s assent). An accord in English is an adherence, a congruence of views with the person prescribing the treatment (opinions are accorded).

Cave versus cave

In French, la cave is a room in the basement, for example for storing wine, and is translated as cellar in English. In English, a cave is a hole in a rocky outcrop, translated as caverne or grotte in French.

Mental versus mental

In anatomy, the English adjective mental refers to the chin (from Latin mentum), as in “mental foramen”. In French, the correct adjective is mentonnier, mental referring to the Latin mens, the mind.

Crane versus crâne

The English crane corresponds to the French grue, whether it is the bird or the machine. The French crâne is translated as skull.

Lunatic versus lunatique

In English, a lunatic person is crazy (loony), while in French a lunatique is someone who changes their opinion on a whim.

Dramatic versus dramatique

In English, dramatic can mean “sudden and striking” and be very positive (e.g., a dramatic increase of cancer remissions). Using the French dramatique here would imply a tragedy with very negative consequences. The proper French translation is spectaculaire, “une augmentation spectaculaire des rémissions de cancer”.

Diaphoretic versus diaphorétique

Quite technical and subtle, but semantically and medically significant. The French adjective diaphorétique only means “that causes perspiration”, while the English adjective diaphoretic also means “perspiring excessively”, both for a person or a skin.

(medical) Adherence versus adhésion (thérapeutique)

In English, a patient’s adherence to treatment is careful compliance with the treatment regimen, including drug dosing, schedule, and other prescribed measures. It is translated by the French observance. While the French adhésion thérapeutique corresponds to the English concordance between the patient and the health care professional when the patient is on-board with the choice made and the decisions taken, and became an active participant in their treatment. Note that in French, adhésion and adhérence are used in different contexts.

To affect versus affecter

The English to affect, meaning to have an effect on something, is (should be) translated by influer sur. The French affecter means to adopt, to pretend if we are talking about a person’s attitude, and to present if we are talking about the features of a thing.

Fastidious versus fastidieux

In French, fastidieux has a negative overtone, describing something repetitive and boring. The English translation is tedious. On the contrary, in English, fastidious may have a positive overtone, describing someone who cares about accuracy and the details, corresponding to the French pointilleux.

legume versus légume

In English, a legume is a plant (or its fruit) belonging to the Leguminosae family, such as beans, peas, peanuts, or lentils. The French translation is légumineuse. In French, a légume is any garden plant cultivated for nutrition, corresponding to English vegetable. In French, a végétal is any plant, mushroom, or alga.

Vocable versus vocable

In English, a vocable is a non-word utterance, such as “la la la”, “Huh”, etc. Now let’s U-turn, in French, a vocable is a word or an expression with very precise, sometimes contextual, semantics.

Employee versus employé

In English, an employee is someone paid by someone else to work for them. In French, employés is a category of workers, whose work is not manual and who are not in a managing position. The correct French translation of employee is salarié.

Idiom versus idiome

In French, idiome means dialect. In English, idiom is an expression with a non-literal meaning. The French version of idiom is idiotisme. In English, idiotism is the condition to be an idiot.

Cricket versus criquet

The French translation of English cricket is grillon. The French criquet is translated into English by grasshopper. In fact, the French stole the English name to mistakenly name all insects of the suborder Caelifera. These are divided into locustes if they can form migrant populations and in sauteriaux if they cannot. Now, the interesting bit is that locuste is the latin name for sauterelle. Therefore, the French criquets are divided in sauteriaux and sauterelles!

Petulant versus pétulant

Petulant in English and pétulant in French have slightly different meanings. The once liberal democrat leader Jo Swinson was called petulant by a labour frontbencher. He meant it as bad-tempered, sulky. In French, pétulant means dynamic, full of energy, which is also what Jo Swinson was… perhaps a bit too much.

Événement indésirable, effet indésirable, effet secondaire

Par Nicolas Gambardella

[English version]

Comme nous l’a montré le déluge de communication autour des vaccins contre la covid-19, la terminologie de pharmacovigilance (le suivi de la sécurité des médicaments, à savoir leur innocuité et leur tolérabilité) peut entraîner de la confusion, voire nourrir les acteurs de la désinformation. l’Organisation mondiale de la santé (OMS) fournit des définitions claires de termes précis qui sont malheureusement souvent détournés de leur sens premier.

Les événements indésirables (adverse event en anglais) recouvrent tout ce dont souffrent les personnes dans les périodes suivant l’administration d’un traitement (qu’il soit prophylactique ou thérapeutique). Les périodes concernées peuvent varier très largement. Un des principaux outils de pharmacovigilance est le recueil des signalements de tels événements indésirable. C’est par exemple le rôle du VAERS (Vaccine Adverse Event Reporting System) des Centers for Disease Control and Prevention (CDC) et de la Food and Drug Administration (FDA) aux États-unis, de l’ANSM (Agence nationale de sécurité du médicament et des produits de santé) en France, ou encore de la MHRA (Medicines & Healthcare products Regulatory Agency) au Royaume-Uni. La survenue ou l’incidence de ces événements ne sont pas nécessairement liées au traitement. Par exemple, dans les cas des vaccins contre la covid-19, la MHRA répertoriait les chutes, les électrocutions, les morsures d’insectes et les accidents de voitures. Bien que l’incidence de ces événements puisse être affectée par certains médicaments, il est peu probable que ce soit le cas pour des vaccins.

Si l’événement peut engager le pronostic vital, on parle d’événement indésirable grave (serious adverse event en anglais). Rappelons la différence entre sévère et grave (severe et serious en anglais). La sévérité est liée à l’intensité d’un phénomène. La gravité est liée aux conséquences de ce phénomène. Un symptôme ou un signe clinique peut être sévère sans être avoir de conséquences majeurs sur la santé et vice-versa. À noter que la gravité dépend du contexte personnel et environnemental. Selon les antécédents du patient et ses circonstances, un événement peut être bénin ou grave.

Quand l’événement indésirable est prouvé être directement en rapport avec le traitement, qu’il soit entraîné par le traitement lui-même ou par les circonstances de son administration, on parle d’événement indésirable associé aux soins (treatment-emergent adverse event en anglais)

Un effet indésirable (adverse effect ou adverse reaction en anglais) est un événement indésirable directement causé par le traitement. Il est à noter que tous les événements indésirables d’un certain type ne sont pas dus au traitement et donc des effets indésirable. Par exemple, les événements thromboemboliques et les myocardites sont des événements relativement fréquents et qui sont parmi les complications principales de la covid-19. Bien que les vaccins à adénovirus et à ARNm, respectivement, aient montré un accroissement de leur incidence dans certaines populations, des analyses statistiques poussées ont été nécessaires

Un effet secondaire (side effect en anglais) est un effet directement dû au traitement, mais qui n’est pas nécessairement indésirable. Par exemple, l’inhibition de l’agrégation plaquettaire par l’aspirine est utilisée pour prévenir la formation de caillots sanguins.

Adverse event, adverse effect, side effect

by Nicolas Gambardella

[Version en français]

As the deluge of communication around the covid-19 vaccines has shown us, the terminology of pharmacovigilance (the monitoring of drug safety, i.e. safety and tolerability) can lead to confusion and even feed the actors of misinformation. The World Health Organization (WHO) provides clear definitions of specific terms, unfortunately often misused.

Adverse events (événements indésirables in French) are anything that people suffer in the periods following the administration of a treatment (whether prophylactic or therapeutic). The periods involved can vary widely. One of the main tools of pharmacovigilance is the collection of reports of such adverse events. This is, for example, the role of the VAERS (Vaccine Adverse Event Reporting System) of the Centers for Disease Control and Prevention (CDC) and the Food and Drug Administration (FDA) in the United States, of the ANSM (Agence nationale de sécurité du médicament et des produits de santé) in France and of the
MHRA (Medicines & Healthcare products Regulatory Agency) in the UK. The occurrence or incidence of these events is not necessarily related to the treatment. For example, in the cases of covid-19 vaccines, the MHRA listed falls, electrocutions, insect bites and car accidents. Although the incidence of these events may be affected by some drugs, this is unlikely to be the case for vaccines.

If the event is life-threatening, it is called a serious adverse event (événement indésirable grave in French). Remember the difference between severe and serious (sévère et grave in French). Severity is linked to the intensity of a phenomenon. Seriousness is related to the consequences of this phenomenon. A symptom or clinical sign can be severe without having significant implications on health and vice versa. We should note that severity depends on the personal and environmental context. Depending on the patient’s history and circumstances, an event may be mild or severe.

When the adverse event is proven to be directly related to the treatment, whether it is caused by the treatment itself or by the circumstances of its administration, it is called a treatment-emergent adverse event (événement indésirable associé aux soins in French)

An adverse effect or adverse reaction (effet indésirable in French) is an undesirable event directly caused by the treatment. Let’s note that not all adverse events of a particular type are caused by the treatment and are therefore adverse reactions. For example, thromboembolic events and myocarditis are relatively common events and are among the main complications of covid-19. Although adenovirus and mRNA vaccines, respectively, have shown an increased incidence in specific populations, further statistical analysis was required

A side effect (effet secondaire en français) is an effect that is directly caused by the treatment but is not necessarily adverse. For example, platelet aggregation inhibition by aspirin is used to prevent blood clots.

Venous thromboembolic diseases

By Nicolas Gambardella

[Version en français]

We are all familiar with the words ‘blood clots’, ‘stroke’ and ‘heart attack’. However, before the media deluge devoted to the extremely rare side effects of certain COVID-19 vaccines, few outside the medical community had heard of thromboembolic events.

The central player in the drama is the thrombus, also known as blood clot. The blood clot is the product of coagulation. The formation of a clot stops a haemorrhage when the blood vessel wall is damaged. The first step is forming a platelet plug formed by the aggregation of platelets, or thrombocytes. The thrombus is then consolidated by strands of fibrin.

A thrombus can block vessels, especially if they are already narrowed, for example in atherosclerosis. This thrombosis impedes blood flow. Thrombosis occurs mainly when the blood flow is slow and steady (otherwise, the clots are torn off). This is why they are primarily found in the veins, forming deep vein thrombosis, also called deep phlebitis, or superficial thrombophlebitis.

A thrombus can break off, forming an embolus that travels through the vessels following the blood flow. If the vessels become smaller, the embolus is more likely to block them. Such an embolism decreases the blood supply downstream, depriving the tissues of oxygen, something called ischaemia, leading to tissue necrosis or infarction.

In the veins, oxygen-deprived blood flows from the small vessels to the large vessels. Therefore, if a clot breaks loose, it does not block the downstream vessels and travels to the heart. It is then sent by the heart into the pulmonary artery. This artery, in turn, splits into smaller and smaller branches, and the clot can then block the circulation. This is a pulmonary embolism. Deep vein thrombosis and pulmonary embolism are two manifestations of venous thromboembolism or phlebitis.

In the arteries, blood flow is rapid and pulsating. As a result, arterial thrombosis is quite rare. However, as the circulation moves from large to small vessels, embolisms are common. The most common examples are coronary artery embolisms, causing destruction of the heart muscle, a myocardial infarction, and cerebral artery embolisms causing cerebral infarction, one of two types of stroke – the other being cerebral haemorrhage.

This brings us to a very rare complication of COVID-19 vaccination with adenovirus vector vaccines such as Vaxzevria from Oxford University and AstraZeneca, and Ad26.COV2.S from Janssen. This complication is called “vaccine-induced prothrombotic immune thrombocytopenia (VITP)”. Indeed, in extremely rare cases, these vaccines induce antibodies to recognise the protein “platelet factor 4“, which activates platelets and causes their aggregation, leading to thrombosis.

Let’s reiterate that these cases are extremely rare, and their incidence is much lower than that observed after infection with SARS-CoV-2, thromboembolic events being one of the main complications of COVID-19.

Les maladies thromboemboliques veineuses

Par Nicolas Gambardella

[English version]

Nous sommes tous familiers des mots « caillots sanguins », « AVC » et « infarctus ». Cependant, avant le déluge médiatique consacré aux effets secondaires extrêmement rares de certains vaccins contre la covid-19, bien peu en dehors de la communauté médicale avaient entendu parler des événements thromboemboliques.

L’acteur central du drame est le thrombus, aussi appelé caillot sanguin. Le caillot sanguin est le produit de la coagulation sanguine. La formation d’un caillot permet d’arrêter une hémorragie lorsque la paroi d’un vaisseau sanguin en endommagée. La première étape est la formation d’un clou plaquettaire formé par l’agrégation de plaquettes, ou thrombocytes. Le thrombus est ensuite consolidé par des brins de fibrine.

Un thrombus peut bloquer les vaisseaux, en particulier s’ils sont déjà rétrécis par exemple dans les cas d’athérosclérose. Cette thrombose entrave la circulation sanguine. Les thromboses surviennent principalement lorsque le débit sanguin est lent et régulier (sinon les caillots sont arrachés). C’est pourquoi on les trouve surtout associées aux veines, formant des thromboses veineuses profondes aussi appelés phlébites profondes, ou superficielles, aussi appelées périphlébites.

Un thrombus peut se détacher, formant un embole qui voyage dans les vaisseaux en suivant la circulation sanguine. Si les vaisseaux deviennent plus petits, ces emboles ont plus de chances de les bloquer. Cette embolie diminue l’irrigation en aval, privant les tissues d’oxygène, ce qu’on appelle une ischémie, ce qui entraîne une nécrose des tissus, ou infarctus.

Dans les veines, le sang privé d’oxygène circule des petits vaisseaux vers les grands vaisseaux. De ce fait, si un caillot se détache, ils ne bloquent pas les vaisseaux en aval, et voyage jusqu’au cœur. Il est alors envoyé par le cœur dans l’artère pulmonaire. Cette artère, quant à elle, se divise en branches de plus en plus petites, et le caillot peut alors bloquer la circulation. C’est une embolie pulmonaire. Les thromboses veineuses profondes et les embolies pulmonaires sont les deux manifestations de la la maladie thromboembolique veineuse ou phlébite.

Dans les artères, la circulation sanguine est rapide et pulsée. De ce fait, les thromboses artérielles sont assez rares. En revanche, la circulation allant des gros vaisseaux vers les petits, les embolies sont fréquentes. Les exemples les plus fréquents sont les embolies des artères coronaires, causant une destruction du muscle du cœur, un infarctus du myocarde, et les embolies des artères cérébrales causant un infarctus cérébral, un des deux types d’accidents vasculaires cérébraux (AVC) – l’autre étant constitué par les hémorragies cérébrales.

Ce qui nous amène à une complication très rare de la vaccination contre la covid-19 par des vaccins utilisant des vecteurs adénovirus comme Vaxzevria de l’université d’Oxford et AstraZeneca, et Ad26.COV2.S de Janssen. Cette complication est la « thrombopénie immunitaire prothrombotique induite par le vaccin (TIPIV) ». En effet, dans des cas extrêmement rares, ces vaccins induisent la production d’anticorps reconnaissant la protéine « facteur plaquettaire 4 » qui active les plaquettes et cause leur agrégation, entraînant des thromboses.

Rappelons une fois encore que ces cas sont extrêmement rares, et leur incidence est bien inférieure à celle observée après infection par le virus SARS-CoV-2, les événements thromboemboliques étant une des complications principales de la covid-19.

Comment traduire « evidence-based medicine » ?

By Nicolas Gambardella

Abordons aujourd’hui une question d’actualité, et qui me tient à cœur, ce que l’on appelle en anglais « evidence-based medicine ». Comment traduire cette expression en français ?

Tout d’abord de quoi parlons-nous ? Depuis des temps immémoriaux, la médecine est un art, et les médecins sont des artisans. Autrement dit, après une formation initiale auprès de mentors, le médecin peaufine ses connaissances et sa réflexion sur la base de son expérience professionnelle. Cette approche présente des inconvénients qu’il n’est pas besoin de développer. Cet état de chose a commencé à évoluer au XIXe siècle avec la « médecine expérimentale » de Claude Bernard, puis au XXe avec l’arrivée de la pharmacologie moléculaire et de l’accélération des connaissances en biologie humaine. La transition de la médecine d’un art en une science s’est parachevée il y a un demi-siècle avec la généralisation des essais cliniques contrôlés, où l’on tâche d’éliminer l’arbitraire personnel et d’évaluer la validité des observations en utilisant des statistiques, souvent sophistiquées. L’avènement récent des données moléculaires à haut débit a ajouté à cet « evidence-based medicine » un aspect de précision et de personnalisation.

Ce qui nous amène à l’utilisation d’un faux ami. « Evidence » est le mot utilisé dans les tribunaux anglo-saxons équivalent au mot français « preuve ». En revanche, en science, « preuve » se dit « proof ». Cette dernière acception est beaucoup plus forte que la précédente (on pourrait du reste discuter longuement sur la différence de statut des « preuves » dans les tribunaux francophones et des « evidences » dans les tribunaux anglo-saxons). Andrew Wiles a fourni la preuve de la conjecture de Fermat (qui devrait donc s’appeler Théorème de Wiles…). Ce théorème de Fermat est toujours vrai. Pour des entiers strictement positifs x, y, z, il n’existe aucun n>2 tel que x2+y2=z2. Ce résultat est vrai, et le restera toujours.

En revanche, les résultats d’une expérience biologique ou d’un essai clinique nous renvoient une image beaucoup plus nuancée. Tout d’abord, les résultats sont associés à un niveau de confiance. Si la valeur p est de 0,05 (une valeur souvent utilisée en statistique médicale), cela veut dire qu’il y a 5 % de chances que le résultat soit dû au hasard (C’est un peu plus compliqué que ça, mais ce n’est pas le sujet du billet). De plus, des résultats différents pourraient être obtenus avec une autre cohorte, présentant d’autres caractéristiques, soit évidentes (âge, sexe, état de santé) soit plus subtiles (une proportion différente d’haplotypes clés entre les groupes témoins et traités). D’où l’existence des méta-analyses, qui permettent de réconcilier plusieurs essais cliniques.

Le résultat d’un essai clinique est très respectable et doit être une référence en l’absence d’information contraire (et de situations particulières comme les circonstances du patient, la disponibilité et le prix des traitements, etc.). Mais ce n’est pas une « preuve ». Je m’insurge donc contre la traduction de « evidence-based medicine » en « médecine fondée sur les preuves », bien qu’elle soit la plus utilisée. C’est selon moi un mauvais anglicisme.

Puisque nous en sommes au chapitre des anglicismes, évacuons de suite le « basé sur ». L’académie française nous dit :

« On s’accorde aujourd’hui pour employer Baser sur dans le domaine militaire et l’y réserver : Des troupes ont été basées sur la frontière. On évitera donc l’emploi figuré, transposition de l’anglais based on, qui s’est abusivement répandu, et on lui préfèrera des synonymes comme Fonder, Établir ou Asseoir. »

Comment dès lors traduire « evidence »? On pourrait, comme Wikipedia, utiliser l’aspect factuel du résultat, et utiliser « médecine fondée sur les faits ». Mais là encore, on confond le résultat et la conclusion. Le résultat de l’essai clinique, qu’un traitement administré selon un certain schéma thérapeutique à une cohorte donnée a probablement entraîné avec une probabilité supérieure à 0,95 une amélioration en moyenne de X %, 95 % des mesures se trouvant dans un intervalle donné autour de X, est un fait. La conclusion, à savoir que le traitement entraîne une amélioration de X % n’en est pas un.

À « fait », je préférerais donc « données », qui est… de fait (sic) le nom le plus utilisé après « preuve ». Au final, le praticien utilisera ces données, en conjonction avec les données venant d’autres essais, de surveillances longitudinales (cohortes ou expérience personnelle), des circonstances du patient, des circonstances géographiques, temporelles, et financière pour décider de la marche à suivre.

Et point n’est besoin de rajouter un adjectif pour ré-introduire la preuve par la petite porte comme on voit souvent avec « médecine fondée sur les données probantes ». Et si par « données probantes » on entend juste des données auxquelles on peut se fier, on tombe dans la tautologie. Si une donnée n’est pas fiable, pourquoi la prendre en compte ?

Evidence-based medicine = Médecine fondée sur les données

De la position des adjectifs

Par Nicolas Gambardella

Il faut toujours mettre l’adjectif au plus près du nom qu’il qualifie. Cela semble évident, n’est-ce pas ? Et pourtant, ce n’est pas un réflexe, surtout dans les textes techniques qui ont tendance à utiliser une syntaxe anglo-saxone. Pourtant, la position de l’adjectif n’est pas neutre, et est au contraire essentielle pour la bonne compréhension du texte et son utilisation ultérieure.

Prenons l’exemple d’un test de grossesse se basant sur la mesure de l’hormone de croissance dans les urines. Faut-il écrire un « test urinaire de grossesse » ou bien un « test de grossesse urinaire » ? Le premier bien sûr, car c’est le test qui est urinaire, pas la grossesse. Au pluriel, il n’y a pas de problème. Dans « tests de grossesse urinaires » les S nous révèlent le lien entre le test et la substance testée. La situation est plus complexe au singulier. Un être humain n’aura bien entendu aucun mal à comprendre qu’une grossesse ne peut être urinaire (du moins on l’espère). En revanche, les systèmes d’analyse lexicale automatique (et un peu simplets, il faut bien le reconnaître) découperont l’expression en

[ TEST ] [ DE ] [ [ GROSSESSE ] [ URINAIRE ] ]

En revanche, un « test de grossesse extra-utérine » teste la localisation extra-utérine (ectopique) de la grossesse. Ici, la grossesse est extra-utérine, pas le test.

Tout cela paraît bien logique. Qu’en est-il en réalité ? Malheureusement, notre ami Google retourne 7970 réponses pour l’infortuné « test de grossesse urinaire » contre seulement 3310 réponses pour « test urinaire de grossesse » (encore que Google Trends donne la première forme gagnante sur le long terme). Le domaine académique fait un peu mieux, Google Scholar retournant 77 entrées pour « test urinaire de grossesse » contre 71 pour « test de grossesse urinaire » Mais il y a pire puisqu’on retrouve cette dernière forme dans des textes de référence comme LE Vidal, voire même des documents de la Haute Autorité de Santé.

Voyons maintenant un exemple plus compliqué, le « rapport normalisé international », traduction de l’anglais « international normalized ratio ». Est-ce vraiment « rapport normalisé international » pour qui Google nous donne 6610 réponses et Google Scholar 99 entrées, ou bien « rapport international normalisé » pour qui Google nous donne 15300 réponses et Google Scholar 234 entrées ? C’est le premier. Cette variable mesure le rapport entre le temps de coagulation chez un patient (le « temps de Quick ») et sa valeur chez un témoin. C’est en cela qu’elle est « normalisée ». Cette mesure étant reconnue internationalement, c’est le « rapport normalisé international ».

Pourquoi la situation est-elle plus compliquée qu’avec le test urinaire de grossesse ? Le mot clé est « normalisé ». Alors que la version anglaise n’est pas ambiguë, elle l’est en français, où l’adjectif « normalisé » est la traduction à la fois de « normalized », c’est-dire une valeur ramenée à l’échelle, et de « standardized », c’est-dire une valeur reconnue officiellement comme une norme. Dès lors, le « rapport international normalisé » pourrait avoir une toute autre signification, qui serait la version « standard » du « rapport international ». Je ne serais du reste pas surpris qu’une grande partie des positionnements malheureux trouvent leur origine dans cette confusion.

En conclusion, toujours placer l’adjectif au plus près du nom ou de l’expression qu’il qualifie. Et si vous traduisez un texte de l’anglais au français, n’hésitez pas à modifier l’ordre d’un enchaînement d’adjectifs en passant d’une langue à l’autre. Enfin, si vous avez le moindre doute, recherchez la signification de l’expression.

Pour traduire, il faut comprendre.

Tolerance, tolerability, innocuousness, safety, relationships, and differences

By Nicolas Gambardella

[French version]

When it comes to clinical trials and pharmacovigilance, using the right word is crucial for an accurate and precise shared understanding. Unfortunately, this is not always the case, even in documents written by specialists. While this can sometimes lead to a certain degree of vagueness in communication within a given language, the situation becomes worse when it comes to documents that need a translation. Especially as the use of given terms may be subject to hyponyms/hyperonyms relationships that differ according to language and context.

In this post, we will look at some terms that generate endless debate in professional forums, all related to safety efficacy data associated with treatments, namely: tolerability, tolerance, safety, innocuousness, and their French equivalents, tolerability, tolerance, safety and innocuousness.

Tolerance and tolerability

Tolerance to treatment is the word used in pharmacology and clinical trials to designate habituation, i.e. the fact that the same intensity of treatment leads to increasingly weaker effects (note that in the field of drug of abuse, the terms tolerance and addiction carry sometimes a subtle difference: Tolerance is the fact that a given dose leads to an increasingly weaker effect, whereas addiction means that higher and higher doses are needed to obtain a given effect). The French translation of tolerance is tolérance.

Tolerability characterises the subject’s ability to withstand adverse effects. While tolerance refers to efficacy data, tolerability refers to safety data. It is a precise term from clinical trials and is not found in any standard dictionary. The French translation of tolerability is tolérabilité. Let’s be honest, these terms are atrocious. However, when it comes to patient safety, the literary elegance and aesthetics of the word are less important than precision and accuracy. “Tolérabilité” is often criticized as “anglicism”, with critics encouraging the use of tolerance to translate tolerability (following in that many French dictionaries). This is forgetting that, in addition to being false, tolerability is itself originally an Anglicism. Perhaps one way to clarify things is to look at adjectives. A person is tolerant to a drug, while a drug is tolerable for a person.

Safety and innocuousness

We are now entering a turbulent zone where tempers flare and linguists grapple with each other. Most of the time, because they are not versed in the handling of ontologies and hyponym/hyperonym relationships. Do safety and innocuousness refer to different concepts? Yes. Do the concepts of safety and innocuousness overlap? Yes. Do safety and innocuousness always translate into the same French terms? No.

Let’s start with innocuousness. The innocuousness of a drug is its ability to work without causing adverse effects (harmlessness). A drug that is innocuous is a safe drug. The term is rarely used in practice, see below. The French translation of innocuousness is innocuité. It should be noted that innocuousness and tolerability are not synonyms. A drug may have a bad innocuousness but good tolerability. For example, it could cause side effects in most cases, these effects being well tolerated.

Where things get complicated is when we approach the notion of safety. The French translation of safety is sécurité. Depending on the context, the concept of safety covers a more or less broad semantic landscape. We will translate the expression “safety and tolerability” by “innocuité et tolérabilbilité“. However, in the expression “safety and efficacy”, safety covers both innocuousness and tolerability. Therefore, we will translate the expression into “sécuritéet efficacité“. Note that “safety” is never translated into “sureté”, although “safe” is translated into “sûr”.

Finally, let us agree that while the greatest precision is necessary between health professionals, it must not lead to pedantry that hinders clear and elegant communication with the patient. We will therefore translate our “commitment to ensuring your safety” into our “engagement à garantir votre bien-être” and not “garantir votre sécurité “. Unless the practitioner is also a bodyguard.