INDEX
Negative Logits
ことが
-0.07
Adds
-0.07
jylland
-0.06
ARGER
-0.06
judge
-0.06
prepar
-0.06
爾
-0.06
cutting
-0.06
Tanrı
-0.06
channels
-0.06
POSITIVE LOGITS
gcc
0.07
-help
0.06
history
0.06
rogue
0.06
Đảng
0.06
/co
0.06
emo
0.05
marg
0.05
lesbi
0.05
Publish
0.05
Activations Density 0.009%