INDEX
Negative Logits
fres
-0.09
lut
-0.09
мит
-0.08
Jahres
-0.08
আক্রান্ত
-0.08
einger
-0.08
aranja
-0.07
excepc
-0.07
感染
-0.07
certainty
-0.07
POSITIVE LOGITS
骚
0.08
Scouts
0.07
BETWEEN
0.07
دين
0.07
Historically
0.07
_RAM
0.07
RAM
0.07
Trabalho
0.07
Tell
0.07
rhetoric
0.07
Activations Density 0.001%