INDEX
Negative Logits
fst
-0.09
എസ്
-0.08
густ
-0.08
kuele
-0.08
земля
-0.08
.wpi
-0.08
षण
-0.08
dek
-0.08
bois
-0.08
बुझ
-0.08
POSITIVE LOGITS
천
0.08
(always
0.08
acting
0.07
unwavering
0.07
Strict
0.07
Throughout
0.07
throughout
0.07
צ
0.07
מד
0.07
obedience
0.07
Activations Density 0.009%