INDEX
Negative Logits
Fire
-0.08
felicit
-0.08
mi
-0.08
ign
-0.08
firing
-0.08
amman
-0.07
kvar
-0.07
kook
-0.07
Salaam
-0.07
papel
-0.07
POSITIVE LOGITS
先锋
0.09
年度
0.09
াইন
0.08
distrust
0.08
年份
0.08
巨
0.08
paranoia
0.08
(inplace
0.08
gigantes
0.08
/...
0.08
Activations Density 0.001%