INDEX
Negative Logits
adrenaline
-0.08
uzz
-0.07
NHS
-0.07
/browse
-0.07
استفادة
-0.07
fishing
-0.07
_ac
-0.07
albeit
-0.07
轴
-0.06
ادة
-0.06
POSITIVE LOGITS
льц
0.07
↵
0.07
FORE
0.07
甍
0.07
_descr
0.07
kończył
0.07
Ꮋ
0.07
Wen
0.07
婍
0.07
メント
0.06
Activations Density 0.002%