INDEX
Negative Logits
-0.09
😂
-0.09
stopwatch
-0.08
humor
-0.08
forb
-0.08
YY
-0.08
हास
-0.08
bucks
-0.08
souvenir
-0.08
joking
-0.08
POSITIVE LOGITS
eenvoudig
0.09
simplicité
0.08
Simple
0.08
généralement
0.08
Labour
0.08
manually
0.08
información
0.08
[↵
0.08
Configure
0.08
_simple
0.08
Activations Density 0.010%