INDEX
Negative Logits
#ad
-0.06
يش
-0.06
wartime
-0.06
Occup
-0.06
AUT
-0.06
Honey
-0.06
jury
-0.06
frogs
-0.06
Hut
-0.06
людей
-0.06
POSITIVE LOGITS
iefs
0.07
."/
0.07
(suite
0.06
HEST
0.06
_SAN
0.06
ุท
0.06
insics
0.06
snaží
0.06
thôn
0.06
jamin
0.06
Activations Density 0.090%