Classification de whiskies single malt par spectroscopie Raman

Oh mon Dieu ! Mais c’est quoi ce titre ? Sont-ils devenus fous chez CocktailMolotov ? Non, tout simplement, on vous avait promis un peu de science sur ce blog, en voici. Rassurez-vous, je vais essayer de vulgariser au maximum. D’ailleurs moi-même, je ne comprends pas tout ce qui se passe au niveau physique ou chimique, en revanche je suis tout à fait qualifié pour vous expliquer les conclusions statistiques de cette étude. L’étude en question est intitulée « Near infrared spectroscopic analysis of single malt Sotch whisky on an optofluidic chip », et on la doit à MM. Ashok, Praveen et Dholakia, du département de physique et d’astronomie à l’université de Saint-Andrews (Ecosse). Comme vous pouvez le voir, déjà au niveau du titre, j’ai fait un effort.

Résumons tout d’abord l’expérience qui a été mise en place par cette bande de joyeux drilles : ils ont utilisé un nouveau composant optofluidique qui permet de faire de la spectroscopie Raman sur différentes catégories de whiskies.  Ils ont ensuite regardé si ce que leur disait leur spectromètre était conforme à ce que les producteurs écrivent sur l’étiquette. C’est dans cette partie-là que mes connaissances sont le plus limitées, donc je vais y aller avec les mains pour expliquer l’expérience. Encore une fois, je vous rassure, je vais essayer d’expliquer simplement chacun des mots biscornus de l’article (optofluidique, spectromètre …).

Description de l’expérience et explications du vocabulaire

1. Le composant optofluidique (contraction d’optique et microfluidique) permet de faire l’analyse avec seulement quelques microlitres (millionième de litre, ou millième de millilitre) de whisky, ce qui évite le gachis de précieux breuvage. Comment ça marche ? On n’a pas vraiment besoin de le savoir. Grosso modo, ça fait la même chose qu’un spectromètre, mais c’est beaucoup plus petit. Mais c’est quoi un spectromètre ?

2. La spectrométrie étudie le spectre d’un phénomène physique. Le cas le plus simple est celui de la spectrophotométrie : on éclaire un objet avec une longueur d’onde très précise (longueur d’onde = couleur), et on regarde ce qui se passe de l’autre côté (baisse de l’intensité lumineuse, phénomène de diffusion etc.) Le phénomène le plus simple à comprendre est celui de la baisse d’intensité lumineuse : si j’éclaire de l’eau, a priori, de l’autre côté, je devrais retrouver une grande partie de l’intensité qui est entrée mais si je rajoute une goutte de sirop, déjà il y en a un peu moins qui va sortir. Si je mets de plus en plus de sirop, j’aurais de moins en moins d’intensité. Bien sûr cela dépend du composant observé, mais aussi de la longueur d’onde que j’utilise. Le sirop de menthe et le sirop de grenadine ne vont pas réagir de la même façon au rouge ou au vert.

Fonctionnement d’un spectrophotomètre

Si je trace l’intensité lumineuse observée en fonction de la longueur d’onde émise, j’obtiens le spectre de mon composant. En général le spectre est assez caractéristique de l’objet observé, et permet de discriminer différents composants inconnus : le spectre du sirop de grenadine est différent du spectre du sirop de menthe. Mais le spectre du sirop de menthe très concentré est différent de celui du sirop de menthe peu concentré. La question posée dans l’article est donc : puis-je faire une discrimination des whiskies par spectrométrie Raman ?

En résumé, le spectromètre est un « oeil » qui peut choisir de ne voir la vie que dans une seule couleur (longueur d’onde).

3. Certains composants, appelés « congeners » sont les principaux responsables du goût particulier d’un whisky, bien que ne représentant pas plus de 1% du contenu total de votre bouteille, les autres composants étant l’eau et l’éthanol. La vodka par exemple, contient très peu de congeners. D’où son goût d’éthanol pur. Après la concentration en alcool et la couleur, les congeners seront donc la troisième composante observée de nos whiskies.

4. Pour étalonner leur appareil, et valider leur modèle, nos chercheurs ont donc créé eux-mêmes leurs propres échantillons d’alcool, en mélangeant de l’éthanol pur avec de l’eau, afin d’obtenir plusieurs concentrations d’éthanol différentes. Ils ont ensuite verifié sur des échantillons commerciaux (Ardberg, Edradour, Glenfiddich, Macallan, Glemorangie – Lasanta et Original, Bruichladdich Links) que leur appareil retrouve bien les concentrations d’alcool promises sur les bouteilles. Ils ont retrouvé les bonnes valeurs à 1% près, on est content pour eux. On est encore plus content de savoir que les marques ne nous mentent pas !

5. C’est ici que les choses deviennent très excitantes. Ils ont utilisés plusieurs jeux de données (je vais d’ailleurs les présenter dans un ordre un peu différent du leur). Premièrement, ils ont étudié un whisky en particulier : le Glenfiddich. Ce paramètre étant fixé, ils ont fait varier celui de l’âge. Différents échantillons de Glenfiddich 12, 15 et 18 ans d’âge ont été prélevés et analysés. Deuxième jeu de données, cette fois-ci chez Glenmorangie, où l’on a regardé les différentes « finitions » : original, Sherry Cask, Sauternes Cask et Port Cask. Troisième jeu de données, chez Bruichladdich, où ils ont étudié le Links, le Wave et le Peat. Et enfin, j’ai gardé le meilleur (à mon goût) pour la fin, où ils avaient des échantillons d’Ardberg, Bruichladdich-Links, Edradour, Glenmorangie, Macallan. Pourquoi ? Tout simplement à cause de cette étude : des experts ont goûté et classé 86 single malt écossais. Ils avaient le choix de leur vocabulaire de description aromatique parmi 500 mots, eux-même regroupés dans 12 familles plus larges : Body (Light-Heavy), Sweetness (Dry-Sweet), Smoky (Peaty), Medicinal (Salty), Feinty (Sulphury), Honey (Vanilla), Spicy (Woody), Winey (Sherry), Nutty (Oaky-Creamy), Malty (Cerealy), Fruity (Estery) and Floral (Herbal). Après une petite classification, fondée sur les descriptions verbales de ces experts, 10 grandes familles sont ressorties, étiquetées de A à J, A et B ou F et G étant deux familles proches, et A et J étant les plus dissemblables. Le but était de fournir aux amateurs de whisky, une possibilité de découvrir des whiskies proches de ceux qu’ils aimaient déjà. Les 5 whiskies retenus pour passer au spectromètre appartiennent aux familles A, B, H, I et J.

Voilà pour les expériences mises en place et pour les 4 jeux de données étudiés.

Passons maintenant à l’analyse statistique des résultats, je devrais être un peu plus précis. Tout d’abord, la technique utilisée est un grand classique de l’analyse statistique, il s’agit de la PCA, appelée ACP en français (Analyses en Composantes Principales).  Pour résumer, l’idée de la technique est de changer le repère dans lequel je vais visualiser mes données, pour que le premier axe soit celui qui maximise la variance des données, le deuxième celui qui maximise le plus la variance après le premier, etc. La variance est la grandeur statistique qui mesure la « dispersion » des données. Plus elle est grande, plus ma représentation est lisible, puisque les données sont « loins » les unes des autres. Quand des données dépendent de nombreuses variables (comme ici, notre spectre dépend de plusieurs longueurs d’onde), cela permet de regarder les données seulement sur les 2 ou 3 premiers axes, et donc de pouvoir les regarder à l’oeil nu (voir en 3D c’est toujours plus facile que de voir en 54D bizarrement).

Pour résumer, au lieu de comparer des spectres, ce qui n’est pas très intuitif, on a résumé tout cela sur deux axes, qui « écartent » au maximum les données les unes des autres. En général, malgré cette dispersion maximale, certaines données restent très proches les unes des autres : on appelle cela un cluster, et on peut supposer que si ces données sont restées très proches, c’est qu’elles ont un rapport. Mais passons aux résultats, tout cela sera plus parlant.

Classification selon l’âge

Classification Glenfiddich 12, 15 et 18 ans d'âge
Graphe représentant les clusters de Glenfiddich 12, 15 et 18 ans d’âge

Retour sur l’échantillon « Glenfiddich », avec trois vieillissement : 12, 15 et 18 ans d’âge. Comme on peut le voir, on identifie clairement trois clusters, et les couleurs sont là pour nous prouver qu’un Glenfiddich 18 ans ressemble beaucoup plus à un autre Glenfiddich 18 ans qu’à la version 15 ou 12.  D’ailleurs dans ce cas-là, même la première composante pourrait les différencier. Ceux qui ont une bonne vue remarqueront quand même quelques points rouges ou verts qui se baladent un peu trop près des clusters de l’autre couleur. On peut expliquer ça par un échantillon un peu différent (peut-être qu’un certain fût de 12 ressemble au 18, parce qu’ils ont changé l’assemblage cette année-là etc.) ou une erreur de manipulation lors de la récupération des données (cellule optofluidique mal néttoyée, inversion de deux échantillons etc. l’erreur est humaine !). Dans l’ensemble, je pense qu’on peut quand même dire que la spectrométrie permet de classer les whiskies selon leur âge.

Classification selon le Cask Finish

Classification de Glenmorangie selon différents Cask Finish
Classification de Glenmorangie selon différents Cask Finish

L’analyse des résultats est encore une fois très facile : les données spectrométriques discriminent parfaitement la finition « Cask » d’un whisky. On remarque que cette fois-ci c’est le deuxième axe qui permet de discriminer clairement le Sherry Cask et le Port Cask. Les fûts de sherry et porto sont donc certainement plus proches l’un de l’autre que d’un fût de bourbon ou de Sauternes.

On n’est pas vraiment étonné par ces deux premiers résultats : rappelons-nous qu’un spectromètre est un appareil qui voit les couleurs de manière plus précise que nous. Or le whisky sort transparent de l’alambic (révélation !), et c’est le vieillissement en fût qui lui donne sa couleur. Pas étonnant donc que le temps passé en fût ou la nature du fût influe grandement sur la couleur du whisky.

Classification selon les arômes

Classification d'assemblages différents de Bruichladdich
Classification d’assemblages différents de Bruichladdich

Ici, les choses se compliquent. Je n’ai pas réussi à trouver précisément sur internet la différence entre ces trois whiskies, mais apparemment il s’agit de séries limitées, choisies et assemblées pour une occasion spéciale. Toujours est-il qu’elles n’ont pas l’air si dissemblables que ça, puisqu’il est quasiment impossible de faire la différence entre le Links et le Peat (et pas seulement parce qu’il n’y a que les deux premières dimensions, les dimensions supérieures n’y changent rien si l’on en croit les auteurs). Alors, deux emballages pour le même whisky ? Pas sûr … en effet, nos chercheurs ont trouvé une autre caractéristique qu’ils n’ont pas étudié : l’effet de  photoblanchiment. Ils « éclairent » le whisky avec une longueur d’onde très précise (où il n’y a pas de pics de Raman … mouais, je suis perdu), et l’observent ensuite 800 secondes après l’éclairage. Les molécules ainsi excitées deviennent fluorescentes, mais perdent petit à petit cette fluorescence. C’est le photoblanchiment.

Décroissance du phénomène de photo-bleaching
Décroissance du phénomène de photo-bleaching

Et cette fois-ci, c’est plus clair, chacun des trois whiskies a une constante de décroissance de son exponentielle différente (le fameux « tau », pour ceux qui ont fait un peu d’équations différentielles dans des systèmes RC ou des décroissances radioactives en terminale S par exemple). Et cette constante permet à elle seule de distinguer tous ces whiskies. On se demande d’ailleurs ce qu’il en est pour les deux premiers jeux de données, mais les auteurs n’en parlent pas.

Classification selon les groupes de Whisky Classified

Enfin, j’ai gardé le meilleur pour la fin (héhéhé !). On arrive à notre jeu de données créé d’après la classification des goûteurs de chez Whisky Classified.

 

5 whiskies choisis parmi les 10 groupes établis par Whisky Classified
5 whiskies choisis parmi les 10 groupes établis par Whisky Classified

 

Ohohoh ! Mais que vois-je ? Premièrement, on arrive à identifier parfaitement les 5 groupes en question. Mais on voit un peu plus que ça. En effet, rappelez-vous : le groupe A est proche du B d’après les experts, mais très éloignés des groupes H, I ou J. Et que voit-on sur ce petit graphe : A tout à droite, clairement séparé de B, lui-même clairement séparé de H,I et J. Mais I et J sont très proches l’un de l’autre, et H n’est pas très loin. Il faut reconnaitre que B est quand même plus proche du groupe H, I, J que de A. Mais enfin, c’est pas mal pour une machine qui n’a pas de nez, pas de papilles, juste des « yeux ». Et puis on ne regarde que deux dimensions.

 

Pourquoi est-ce que ce résultat est le plus important pour moi ? Tout simplement parce qu’il est une validation objective des résultats trouvés par les sens d’un être humain, sens qui, on pourrait le croire, sont plus subjectifs. C’est aussi la preuve que les experts goûteurs étaient bons. Inversement, peut-on remplacer un goûteur par une machine ? Si on veut aller plus loin, on peut se dire que les résultats sont déjà bons avec des scotch. Quid de la claissification d’autres alcools de céréale ? Bourbon, Rye, whisky japonais, mais aussi vodka … Et puis continuons avec les rhums, cognacs, gin, tequila, mezcal … Et pourquoi pas les cocktails ? Retrouve-t-on les grandes familles de cocktails quand on utilise cet appareil ? Sachant encore une fois qu’on n’a qu’une information optique, que se passerait-il si on avait aussi une information plus chimique comme le pH par exemple ? Que de questions, si peu de réponses, mais ne vous inquiétez pas, CocktailMolotov est là pour ça !