INDEX
Negative Logits
dones
-0.08
Fro
-0.08
hum
-0.07
elders
-0.07
sess
-0.07
�
-0.07
medi
-0.07
sup
-0.07
tra
-0.07
повышения
-0.07
POSITIVE LOGITS
Chang
0.07
Monkey
0.07
_Display
0.07
Colorado
0.07
October
0.07
Outro
0.07
.cont
0.07
Sasha
0.07
oku
0.07
ريب
0.07
Activations Density 0.004%