INDEX
Negative Logits
denge
-0.09
.experimental
-0.09
ogether
-0.08
chores
-0.08
demolition
-0.08
ုံး
-0.08
Prote
-0.08
Prote
-0.08
ofu
-0.08
illion
-0.08
POSITIVE LOGITS
alasan
0.09
_reason
0.09
reason
0.09
理由
0.09
이유
0.09
Reason
0.08
razlog
0.08
原因
0.08
_REASON
0.08
تقول
0.08
Activations Density 0.006%