INDEX
Negative Logits
worden
-0.07
TICK
-0.06
professional
-0.06
ffiti
-0.06
_upper
-0.06
シ
-0.06
_binding
-0.06
팀
-0.06
-dir
-0.06
grand
-0.06
POSITIVE LOGITS
davranış
0.06
огу
0.06
escalation
0.06
arget
0.06
(instr
0.06
owing
0.06
переда
0.06
On
0.06
tritur
0.06
sire
0.06
Activations Density 0.000%