INDEX
Negative Logits
容
-0.08
μη
-0.08
ുട്ട
-0.08
ار
-0.07
factura
-0.07
Messe
-0.07
bund
-0.07
PK
-0.07
-lived
-0.07
objectively
-0.07
POSITIVE LOGITS
lime
0.08
ANSWER
0.08
answer
0.08
claim
0.07
246
0.07
apologies
0.07
surprisingly
0.07
И
0.07
_reports
0.07
Ja
0.07
Activations Density 0.013%