INDEX
Negative Logits
Hib
-0.10
formative
-0.08
您好
-0.08
-born
-0.08
родителей
-0.07
tront
-0.07
你好
-0.07
Https
-0.07
apporte
-0.07
πέ
-0.07
POSITIVE LOGITS
osv
0.08
atmosfera
0.08
clearing
0.07
avy
0.07
dtype
0.07
serpent
0.07
ệm
0.07
"><?=
0.07
SOC
0.07
WAR
0.07
Activations Density 0.009%