INDEX
Negative Logits
.En
-0.07
Lin
-0.07
in
-0.07
immigrants
-0.07
Human
-0.07
projector
-0.07
iam
-0.07
ich
-0.06
avorites
-0.06
Bien
-0.06
POSITIVE LOGITS
đến
0.07
َ
0.07
ATO
0.07
造成
0.07
_PLATFORM
0.06
fruitful
0.06
_longitude
0.06
态
0.06
contrad
0.06
etler
0.06
Activations Density 0.026%