INDEX
Negative Logits
Ann
-0.08
Win
-0.08
Should
-0.08
.Al
-0.07
ann
-0.07
国外
-0.07
Auf
-0.07
situated
-0.07
anomalies
-0.07
zuletzt
-0.07
POSITIVE LOGITS
quotid
0.09
accustomed
0.09
citizens
0.09
cotidiana
0.09
Alltag
0.09
quotidienne
0.09
naturalmente
0.08
Inte
0.08
FIRE
0.08
folk
0.08
Activations Density 0.037%