INDEX
Negative Logits
itſelf
-0.99
دانشنامهٔ
-0.92
Хьажоргаш
-0.84
GEBURTSDATUM
-0.81
Personendaten
-0.79
Cæsar
-0.79
Rondo
-0.77
theless
-0.76
Anſ
-0.75
ppure
-0.75
POSITIVE LOGITS
0.62
“
0.60
"
0.57
Mau
0.52
a
0.51
native
0.51
s
0.51
Sy
0.50
asting
0.48
quot
0.48
Activations Density 0.006%