INDEX
Explanations
mentions of actors and the act of pouring
New Auto-Interp
Negative Logits
CreateMap
-0.66
Amicalement
-0.64
médicaux
-0.64
bahaya
-0.63
avancé
-0.63
actuelle
-0.62
quelcon
-0.62
préférable
-0.61
automatiques
-0.60
polaire
-0.60
POSITIVE LOGITS
Pour
1.03
Pour
0.99
poured
0.99
pour
0.98
pouring
0.97
actor
0.94
pours
0.86
actors
0.85
Actors
0.81
pour
0.80
Activations Density 0.064%