INDEX
Negative Logits
Michelin
-0.09
inm
-0.07
importe
-0.07
muss
-0.07
touching
-0.07
wart
-0.07
kilometers
-0.07
needles
-0.07
devise
-0.07
polate
-0.07
POSITIVE LOGITS
disliked
0.09
�
0.09
thất
0.08
denial
0.08
rån
0.08
Sally
0.08
CTV
0.08
Cp
0.08
antagon
0.08
granted
0.08
Activations Density 0.001%