🆕 Your Taste Match (beta) - help us tune it with your hits and misses

Good morning, when I open the page of any rum, there is now a match percentage in the top right corner. I assume it is based on the scores of my entries. Does it also take specific tasting notes into account? As in when they match a - for me - high scoring rum, that the percentage will also be higher? And does it get more accurate in case you have a big difference between your lowest and highest scoring rums?
I think it is a wonderful feature that gives you a quick reference to your taste profile. Great for newbies but also very useful for the nerds.
Thanks for developing this!

6 Likes

Good morning, and thanks for the kind words. :heart: Really glad you discovered it and it’s useful already. It’s a “silent beta” where I want to gather real life feedback from.

So yes, your ratings are the base, but it’s not just the numbers. The tasting notes matter a lot too. If a rum has the same kind of flavor fingerprint as the ones you’ve rated high, the % goes up. If it’s full of notes you’ve rated low in the past, it goes down. On top of that we also look at more “hard” stuff like style, age, ABV, sugar, single cask, price range… a lot of us have pretty clear preferences there, whether we realise it or not.

And once you’ve rated enough rums, a second layer kicks in: basically “people who rate similar to you also liked this one”. That part gets stronger the more you use the app, yes.

About the spread, you nailed it. The bigger the gap between your highest and lowest rated rums, the better the profile. And honestly: the algorithm needs your bad reviews just as much as the good ones. A wall of 80s tells us almost nothing. A proper 45 on something you really didn’t like is gold. So please don’t be shy with the low scores.

Which brings me to a small ask for the whole community: how are your matches actually landing? Would love some real examples, both ways.

  • Where did it nail it? (“95% on Hampden, spot on, one of my all-time favourites”)

  • Where was it way off? (“92% on a spiced rum I can’t stand”)

  • And: does adding a low rating on something actually shift your matches in a direction that feels right?

Just drop them in this thread with the rum name and the %. The more we see, especially the misses, the faster we can make this better. It’s live but still early days, and the only way it gets genuinely good - for newbies and nerds - is if we go through this together.

Thanks again for taking the time to write this up.

Cheers,
Oliver

17 Likes

Krasses, nĂĽtzliches feature, vielen lieben Dank!

Man beachte auch die stilisierte Erd- und Mondumlaufbahn um die Sonne. :hugs: Oder irre ich mich da?

5 Likes

Hier z. B. hätte ich eindeutig einen höheren Prozentsatz erwartet, da ich sehr auf TDL stehe (außer 1999, 2005, 2006)

6 Likes

Bei Rums noch ganz ohne Wertung ist super schwierig. Da hat der Algorithmus weder Bewertungs- noch Geschmacks-Signale. Eventuell blende ich den Score dann bei diesen neuen Rums aus. Aber erstmal testen. :folded_hands:t3:

8 Likes

Hab das Feature auch gesehen, sehr cool und wirklich nützlich, insbesondere wenn man bei einem Rum noch unentschlossen ist (zumindest.B.) für die Versandoptimierung. Hier wäre aus meiner Sicht auch ein schöner Use Case: Was hat der Shop noch übereinstimmend mit meinem Geschmacksprofil absteigend sortiert. Wenn man dann noch den üblichen Kaufpreis der eigenen Sammlung einbezieht, könnte man den 1978ER Skeldon (zumindest in meinem Fall) noch schnell filtern und voila!

Eine Mindestanzahl an Bewertungen wĂĽrde ich auch begrĂĽĂźen. Das Featurw braucht sich auf jeden fall nicht zu verstecken ein paar Stichproben waren bereits sehr treffend

5 Likes

hatte ich heute auch bei dem 83er C<>H von Rob, wo ich dachte, das kann nicht sein, wo ich zB den RA 83er HGML bei 94 Punkten habe. Mir dämmerte dann aber auch, dass das an an den wenigen vorhandenen Bewertungen liegen muss. Bei solchen Rums konnte man sich doch zunächst einfach an den Rahmendaten orientieren @Oliver? Bspl. 94er NY, 95er EMB, 94er REV…da weiss ich fast immer, dass das passt…

3 Likes

Wo er bei mir wirklich stark daneben liegt ist alles kontinental gelagerte. Da ist es egal welche Brennerei oder welches Alter. AuĂźer Old School PM, 94 Rev oder 91 KFM mag fast nichts kontinentales. Aber das scheint im Algorithmus nicht erfasst

3 Likes

Was genau sagt der Wert aus? Mein prognostiziertes Rating? Oder wie sehr er bisher mit meinen hohen Ratings ĂĽbereinstimmt? Kannst du das noch spezifizieren.

2 Likes

Es wäre natürlich prima wenn das Match-Rating eine Richtschnur wäre, ob einem das Teil schmeckt oder eher nicht. Man kann theoretisch natürlich auch eine Flasche objektiv hoch bewerten wegen der Qualität ohne dass der Stil zwingend der bevorzugten Richtung entspricht. Wohl ein gewisser Zielkonflikt für die Frage was die eigenen Bewertungen wiederspiegeln sollen. Wäre gut zu verstehen, wo da der Schwerpunkt vom Konzept liegen soll.

2 Likes

Wow, dankeschön für das viele Feedback! :heart:

Genau dafür läuft das Ganze gerade als Silent Beta. Der Score ist live, aber der Algorithmus dahinter steht wirklich noch ganz am Anfang. Jeder Treffer und jeder Fehlschuss den ihr hier postet, fließt direkt ins nächste Tuning ein. Das ist keine Floskel. Das Update das ich gestern gemacht habe beruht zu großen Teilen auf euren Beobachtungen in diesem Thread plus einer Analyse auf rund 10.000 echten Bewertungspaaren aus der Community.

Zu den Fragen.

Leo und ThreeH, was der Prozentwert aussagt: es ist eine Vorhersage eurer eigenen Bewertung, nicht eine objektive Qualitätsnote. Sprich, 88 % heißt „du würdest diesen Rum vermutlich irgendwo um die 8.8 Punkte bewerten". Das ist bewusst so kalibriert und wird gegen echte Bewertungen gemessen, die mittlere Abweichung liegt gerade bei rund 0.2–0.3 Punkten sobald genug Daten da sind. Damit klärt sich auch der Zielkonflikt den ThreeH anspricht: wenn du einen Rum qualitativ hoch bewertest obwohl er stilistisch nicht dein Ding ist, dann lernt der Algorithmus genau das, weil er deine persönliche Rating-Funktion modelliert und keine abstrakte Qualitätsachse. Wer so bewertet wie er trinkt, bekommt die besseren Empfehlungen.

Was in den Score einfließt, grob in der Reihenfolge in der es greift: AI-Geschmacksachsen (süß↔trocken, fruchtig↔holzig, mild↔intensiv, Expertise), dann das Tag-Profil aus allen Community-Tastings des Rums, dann harte Rahmendaten (Style, Alter, ABV-Band, Preis, Single Cask, Sugar, Raw Material, Limited Edition) und schließlich das kollaborative Filtern. „Leute die bewerten wie du, bewerten diesen Rum im Schnitt so und so". Der CF-Pfad wird ab fünf eigenen Bewertungen freigeschaltet und dominiert dann zunehmend, weil er mit Abstand der genauste ist. Rumman, zu deiner Frage: ja, deine eigenen Tasting Notes zählen doppelt — einmal als Input für dein Profil, einmal als Input für das Rum-Profil über alle Tastings hinweg.

Rumman, zu deinem Spread-Punkt: total richtig. Der Algorithmus lernt aus Unterschieden, nicht aus Noten. Eine 4.5 auf einem Rum den du wirklich nicht magst ist mehr wert als zehn weitere 8.2er. Deshalb gibt es parallel zur Vorlieben-Signatur auch eine Dislike-Signatur aus euren Bewertungen unter 5.0, die aktiv Punkte abzieht wenn ein Rum in die Richtung eurer Abneigungen geht. Wer nur 7.5–9.0 bewertet, hat faktisch ein eindimensionales Profil.

Gunnar und mto75, euer Thema mit den neuen Rums, Gunnar bei T.D.L ohne Wertungen, mto75 beim Hampden C<>H 1983 mit gerade mal fünf. Wenn ein Rum weder Community-Bewertungen noch Tasting-Notes hat, fehlen Tag-Profil und CF-Embedding komplett. Übrig bleiben nur die harten Daten, und die allein reichen nicht um Destillerie, Jahrgang und Mark einzuordnen - weil basierend auf den Daten es halt doch große Qualitätsunterschiede auch in den “Geschwistern” gibt. Genau deshalb habe ich die Badge-Logik diese Woche angepasst: in solchen Fällen wird der Score künftig ausgeblendet statt eine irreführende 76 % anzuzeigen. Sobald ein paar Community-Tastings da sind, kommt er zurück.

mto75, zu deinem Vorschlag das über Rahmendaten (Destillerie + Jahrgang + Mark) heuristisch aufzufüllen, das ist der Punkt an dem es spannend wird und wo ich einen Kompromiss fahren muss. Ich hab mehrere Varianten davon gebaut und getestet: Imputation des CF-Embeddings über Destillerie-Jahrgang-Nachbarn, Distillery-Affinität als Fallback, Mark-basierte Korrektur. Für die Geek-Edge-Cases hat das die Scores genau da zurechtgebogen wo man es erwartet, aber in der Breite hat jede dieser Varianten die Gesamtgenauigkeit im Blindtest verschlechtert. Bei 5–10 % Edge-Cases Signal, bei 90 % Mainstream-Nutzern Rauschen, das den CF-Pfad kaputtgemacht hat.

Anders gesagt, und das ist der wichtige Punkt: Einsteiger profitieren überproportional von diesem Feature, weil sie ihren eigenen Geschmack noch nicht aus dem Stegreif einordnen können. Da macht die Schwarmintelligenz den Unterschied. Ihr Nerds wisst meistens selbst schon dass ein 95er NY oder ein 94er REV passt, mto75, genau wie du es beschreibst. Die Versuchung den Algorithmus für die letzten paar Prozent Geeks scharfzustellen würde die 95 % schlechter machen. Deshalb fahre ich den Trade-off bewusst konservativ: lieber ehrlich „weiß ich nicht" und Badge ausblenden als falsch selbstbewusst 76%.

Serge, kontinentale Lagerung: guter Punkt. Steht aktuell nicht als hartes Feature drin, das System sieht Alter und ABV aber nicht Trop vs. Continental. Ich setze es auf die Liste.

w00tAN, Match Score in Shop-Listen mit Sortierung: auf der Roadmap. Das ist genau der Use Case fĂĽr den der Score ĂĽberhaupt existiert, Entscheidung vor dem Kauf statt nach dem Ă–ffnen.

Und noch zum Tuning von gestern für alle die das Feature schon länger verfolgen: ich hab die Blend-Gewichte auf Basis von 10.055 echten Bewertungspaaren neu kalibriert. Die mittlere Abweichung zur tatsächlichen Bewertung ist von rund 3,2 auf 1,8 Punkte gefallen. Besonders deutlich spürt ihr das mit 5–30 eigenen Bewertungen (dort lag der Fehler vorher bei 5–8 Punkten, jetzt bei 2–3), und die Niche-Archetypes (Agricole-Fans, Single-Cask, Spiced-Fans) profitieren am meisten. Vorher-Nachher-Feedback sehr willkommen. Kommt im nächsten App-Update! :rocket:

Nochmal danke an euch alle. Das Ding steht wie gesagt wirklich noch am Anfang und wird nur dadurch gut dass wir hier genauso weitermachen. Also bitte weiter Treffer und FehlschĂĽsse posten, mit Rumnamen und Prozentwert, und gerne auch ob eine neue schlechte Bewertung eure Matches sinnvoll verschiebt oder nicht.

Cheers und einen schönen Sonntag,
Oli

17 Likes

Dann ist das ja mal ein ziemlich affengeiles Feauture, was auch noch pädagogisch die Nutzer dazu erzieht endlich vernünftige Bewertungen abzugeben.

Gestern hatte ich RX11474 im Glas und aus der prognostizierzen 91% ist eine reelle 92 Punkte geworden. Und das bei nur 7 Vorbewertungen.

10 Likes

Ich finds prinzipiell auch ein tolles feature. Meine Frage ist wie der Algo mit “widersprüchlichen” Präferenzen umgeht?

Beispiel ich mag komplexe TDL sowie ester Note find, die können dann schon recht trocken ausfallen, aber als Dessertersatz auch mal sowas wie ein ah Rise Ultra Rare cool. Kommt halt immer stark aufs Gesamtgeschmackserlebnis an und für was ich ihn nutzen möchte. Kann der Algo mit sowas umgehen oder müsste ich mich dann für eine Schiene entscheiden und die andere entsprechend nicht bewerten?

2 Likes

Ja so wie ich Olli verstanden habe istbes genau deswegen wichtig, auch deine Tasting notes einzutragen und nicht nur stur Punkte zu verteilen.

3 Likes

You sir, are a very consistent taster. The one point difference shows that you are human and not a robot. Hat off to you Leo! :wink::smiley:

5 Likes

Jawoll, in dieser Kombi “Prozentsatz + verbale Begründung” absolut hilfreich, ein unglaublich wertvolles Feature! :+1::+1::+1:

@Oliver

ich glaube, der Wert und die Dimension dieses dynamischen Features wird dir und uns erst nach und nach bewusst werden.

Das wird ein Quantensprung sein.

7 Likes

@Oliver … ich habe das neue Feature jetzt auch mehrmals getestet und kann Dir dazu nur gratulieren. Bis auf minimale Abweichungen hat es oft meine Geschmackstendenzen getroffen.

Eine geniale Idee… und mit Sicherheit zukünftig ein zentrales Element in Deiner App.

10 Likes

absolutes Killer-Feature :flexed_biceps: :smiley:

@Gunnar nach dem App Update gerde, zeigt es fĂĽr den 83er C<>H bei mir nun nichts mehr an, so wie von Oli angekĂĽndigt

8 Likes

Also der hier reizt mich ja schon sehr stark. Ein 4 jähriger Rum, bei dem mir eine 96 vorhergesagt wird. Die Finger jucken bei 130€

13 Likes

Mach es!
Beim Split wäre ich mit 5cl dabei, auch wenn ich nur 87% habe :wink:

1 Like