INDEX
Negative Logits
_plugins
-0.08
отвеч
-0.07
advisers
-0.06
içeri
-0.06
content
-0.06
содерж
-0.06
リ
-0.06
Urls
-0.06
newX
-0.06
IDs
-0.06
POSITIVE LOGITS
.Inv
0.08
Ζ
0.07
abytes
0.06
ErrorHandler
0.06
rustic
0.06
approximate
0.06
rupted
0.06
peating
0.06
-fiction
0.06
��
0.06
Activations Density 0.000%