INDEX
Negative Logits
ασ
-0.08
orget
-0.08
(,
-0.08
irut
-0.07
_SCORE
-0.07
astikan
-0.07
astore
-0.07
Duft
-0.07
genieten
-0.07
అవకాశ
-0.07
POSITIVE LOGITS
screenplay
0.09
警
0.08
_warning
0.08
高潮
0.08
.WARNING
0.08
-warning
0.08
warning
0.08
अगर
0.07
剧情
0.07
warning
0.07
Activations Density 0.009%