INDEX
Negative Logits
fear
-0.09
rank
-0.08
Phil
-0.08
pij
-0.07
27
-0.07
টির
-0.07
SDS
-0.07
gente
-0.07
associate
-0.07
.safe
-0.07
POSITIVE LOGITS
-gap
0.07
distal
0.07
不给
0.07
('-0.07
ellar
0.07
acher
0.07
incred
0.07
(argv
0.07
unspecified
0.07
0.07
Activations Density 0.000%