INDEX
Negative Logits
_AUTH
-0.07
Lex
-0.07
profiles
-0.07
business
-0.07
aret
-0.06
ТО
-0.06
FOUND
-0.06
/train
-0.06
.xyz
-0.06
knih
-0.06
POSITIVE LOGITS
applause
0.11
applauded
0.11
applaud
0.10
cheer
0.08
appl
0.07
事務
0.07
іли
0.07
steder
0.07
spectacular
0.06
cheered
0.06
Activations Density 0.004%