INDEX
Negative Logits
záznam
-0.07
्तन
-0.07
vešker
-0.07
قرار
-0.06
аного
-0.06
prolet
-0.06
ALSE
-0.06
aup
-0.06
rağmen
-0.06
ぞ
-0.06
POSITIVE LOGITS
ังกฤษ
0.07
_groups
0.07
cracking
0.06
ımı
0.06
Before
0.06
Little
0.06
رد
0.06
дя
0.06
Jordan
0.06
-----------
0.06
Activations Density 0.030%