INDEX
Negative Logits
ensus
-0.08
Say
-0.08
Mahal
-0.08
Deutsche
-0.07
Comput
-0.07
Finds
-0.07
వీ
-0.07
učen
-0.07
ług
-0.07
తెలుస
-0.07
POSITIVE LOGITS
secular
0.08
tenue
0.08
stagnant
0.08
aaye
0.08
prohibits
0.08
тоже
0.08
repress
0.08
toile
0.08
alej
0.08
prohib
0.08
Activations Density 0.007%