INDEX
Negative Logits
rampant
-0.09
wreak
-0.07
Mg
-0.07
ਓ
-0.07
ignment
-0.07
reflux
-0.07
Cuts
-0.07
cycl
-0.07
turned
-0.07
phal
-0.07
POSITIVE LOGITS
则
0.09
субъ
0.09
معدل
0.08
idem
0.08
castles
0.08
restante
0.08
TBD
0.08
emoji
0.07
contin
0.07
زم
0.07
Activations Density 0.007%