INDEX
Negative Logits
valley
-0.08
avati
-0.07
pong
-0.07
rody
-0.07
NOTICE
-0.07
divider
-0.07
že
-0.07
-0.07
Oakland
-0.07
Bowen
-0.07
POSITIVE LOGITS
Tass
0.08
�
0.08
wit
0.08
Spar
0.08
кам
0.08
kü
0.08
0.08
Pf
0.07
ouvertes
0.07
�
0.07
Activations Density 0.002%