INDEX
Negative Logits
slashes
-0.08
_nf
-0.08
fom
-0.07
migrated
-0.07
gerald
-0.07
/wiki
-0.07
nid
-0.07
slash
-0.07
Wick
-0.07
coy
-0.07
POSITIVE LOGITS
播放
0.09
reproducción
0.09
durata
0.08
synchronize
0.08
universities
0.08
autoplay
0.08
течение
0.08
Sticky
0.08
Sunt
0.08
voluntad
0.08
Activations Density 0.001%