INDEX
Negative Logits
dab
-0.09
XD
-0.08
REP
-0.08
-ever
-0.08
Sobre
-0.08
_click
-0.08
Republic
-0.08
_conf
-0.08
ub
-0.08
arbeiten
-0.08
POSITIVE LOGITS
AE
0.08
boyfriend
0.07
lateral
0.07
体系
0.07
الآ
0.07
药
0.07
融
0.07
technische
0.07
ร
0.07
ательного
0.07
Activations Density 0.001%