INDEX
Negative Logits
ୁ
-0.08
iction
-0.07
प्रसिद्ध
-0.07
-0.07
Hopefully
-0.07
igung
-0.07
owns
-0.07
आनंद
-0.07
uje
-0.07
માં
-0.07
POSITIVE LOGITS
违规
0.08
insuf
0.08
комб
0.08
انه
0.08
comité
0.08
parti
0.08
QUICK
0.08
స్ట్
0.08
იმის
0.08
ונה
0.08
Activations Density 0.001%