INDEX
Negative Logits
low
-0.08
continuous
-0.08
容
-0.07
charged
-0.07
ebook
-0.07
etz
-0.07
Hedge
-0.07
ivu
-0.07
low
-0.07
alyze
-0.07
POSITIVE LOGITS
deft
0.08
leaked
0.08
काल
0.07
magic
0.07
сайта
0.07
Montes
0.07
_magic
0.07
uelo
0.07
dotyczą
0.07
phishing
0.07
Activations Density 0.001%