INDEX
Negative Logits
Grass
-0.09
.Resource
-0.08
elif
-0.08
سبح
-0.08
ստ
-0.08
artifact
-0.08
sonido
-0.08
.or
-0.08
_RESOURCE
-0.08
_resource
-0.08
POSITIVE LOGITS
compromising
0.10
symptoms
0.09
症
0.09
Symptoms
0.09
exacer
0.09
exacerb
0.09
hamp
0.08
Sympt
0.08
攻击
0.08
Toxic
0.08
Activations Density 0.010%