INDEX
Negative Logits
성
-0.10
Australian
-0.08
Anglican
-0.08
元
-0.08
parasites
-0.08
taon
-0.07
ercial
-0.07
Maori
-0.07
فات
-0.07
viation
-0.07
POSITIVE LOGITS
स्थिति
0.09
jeb
0.08
cibl
0.08
indent
0.08
Multi
0.08
[target
0.08
-phase
0.08
chaw
0.08
coord
0.08
եթե
0.07
Activations Density 0.001%