INDEX
Negative Logits
ầm
-0.08
toilets
-0.08
William
-0.08
arau
-0.08
بوط
-0.08
acken
-0.07
abortions
-0.07
hardcore
-0.07
imony
-0.07
#↵↵
-0.07
POSITIVE LOGITS
banget
0.08
tahu
0.08
busca
0.08
conj
0.08
eagerly
0.07
spe
0.07
equ
0.07
奋
0.07
ဆုံး
0.07
-packed
0.07
Activations Density 0.009%