INDEX
Negative Logits
Spy
-0.08
حق
-0.07
چہ
-0.07
-0.07
ossi
-0.07
นั้น
-0.07
maravill
-0.07
ومع
-0.07
Cycling
-0.07
Yar
-0.07
POSITIVE LOGITS
tame
0.09
torr
0.08
Byron
0.08
चल
0.08
pran
0.07
潮
0.07
ionic
0.07
versch
0.07
altern
0.07
cond
0.07
Activations Density 0.011%