INDEX
Negative Logits
-0.08
ుకున్న
-0.08
-Bar
-0.07
russ
-0.07
-0.07
తర
-0.07
Hi
-0.07
approxim
-0.07
Ola
-0.07
İ
-0.07
POSITIVE LOGITS
misuse
0.15
用途
0.14
usos
0.12
malicious
0.12
استخدامها
0.11
применение
0.11
wield
0.11
toepassingen
0.10
admin
0.10
الاستخدام
0.10
Activations Density 0.038%