INDEX
Negative Logits
tham
-0.08
sab
-0.08
Bein
-0.08
Ehe
-0.07
Devil
-0.07
łam
-0.07
bandar
-0.07
teil
-0.07
союз
-0.07
সো
-0.07
POSITIVE LOGITS
PX
0.08
erken
0.08
piz
0.08
ausp
0.07
achievement
0.07
પ્રસ
0.07
ซ
0.07
agua
0.07
Abstract
0.07
ditt
0.07
Activations Density 0.011%