INDEX
Negative Logits
pren
-0.08
ged
-0.08
Pren
-0.08
precaution
-0.07
iche
-0.07
ın
-0.07
ttl
-0.07
विद
-0.07
نق
-0.07
considér
-0.07
POSITIVE LOGITS
Doe
0.09
0.09
vent
0.08
Maiden
0.08
烈
0.07
Sheep
0.07
Bor
0.07
-fashioned
0.07
.wind
0.07
William
0.07
Activations Density 0.020%