INDEX
Negative Logits
ann
-0.09
Vil
-0.08
adl
-0.08
Firewall
-0.08
varias
-0.07
unser
-0.07
aden
-0.07
desal
-0.07
互
-0.07
كد
-0.07
POSITIVE LOGITS
трудно
0.08
�
0.07
0.07
.webdriver
0.07
ू
0.07
Tiger
0.07
ूँ
0.07
Bogotá
0.07
ges
0.07
trophy
0.07
Activations Density 0.002%