INDEX
Negative Logits
Allan
-0.09
Roosevelt
-0.09
pon
-0.08
edm
-0.08
Tep
-0.08
Maar
-0.08
regra
-0.08
einzig
-0.08
Eis
-0.08
棒
-0.08
POSITIVE LOGITS
ata
0.08
classiques
0.08
icles
0.08
anales
0.07
neza
0.07
icipant
0.07
mus
0.07
icle
0.07
_cursor
0.07
atics
0.07
Activations Density 0.003%