INDEX
Negative Logits
castig
-1.40
ant
-1.40
ar
-1.34
to
-1.31
$+
-1.29
G
-1.27
✅
-1.27
чле
-1.26
!!!!!!!!!!!!!!!!
-1.26
-
-1.26
POSITIVE LOGITS
from
2.23
Eigentü
1.60
okno
1.55
شهرهای
1.51
ↀ
1.49
gencias
1.48
pomi
1.46
tividade
1.44
metody
1.40
насељу
1.38
Activations Density 0.016%