INDEX
Negative Logits
jama
-0.08
mortar
-0.08
.alert
-0.08
jav
-0.07
advent
-0.07
occasional
-0.07
.rm
-0.07
build
-0.07
until
-0.07
Glouc
-0.07
POSITIVE LOGITS
enche
0.09
rozh
0.08
راج
0.08
、副
0.08
tails
0.08
बिह
0.08
enne
0.08
0.08
Exists
0.08
beda
0.08
Activations Density 0.001%