INDEX
Negative Logits
roscope
-0.09
Counters
-0.09
toughness
-0.09
cycling
-0.08
women
-0.08
дением
-0.08
Selective
-0.08
preto
-0.08
дение
-0.08
pton
-0.08
POSITIVE LOGITS
ולה
0.09
shrink
0.08
cedar
0.08
לה
0.08
-u
0.07
donnée
0.07
convict
0.07
貸
0.07
symbolic
0.07
resort
0.07
Activations Density 0.001%