INDEX
Negative Logits
Nir
-0.06
sehr
-0.06
δει
-0.06
BK
-0.06
act
-0.06
řeb
-0.06
DisplayName
-0.06
chant
-0.06
_L
-0.06
Kr
-0.06
POSITIVE LOGITS
_TEAM
0.07
tuo
0.07
Todo
0.07
tisí
0.07
Instances
0.07
τύ
0.07
teach
0.07
想到
0.06
todo
0.06
pharmacies
0.06
Activations Density 0.013%