INDEX
Negative Logits
Meng
-0.08
shy
-0.08
הזה
-0.08
Refin
-0.07
Montgomery
-0.07
Tec
-0.07
aur
-0.07
gesund
-0.07
Dette
-0.07
-0.07
POSITIVE LOGITS
candles
0.10
fireworks
0.09
起来
0.08
бор
0.08
ulang
0.08
lại
0.08
cele
0.08
dinner
0.08
crackers
0.08
humm
0.08
Activations Density 0.009%