INDEX
Negative Logits
_chat
-0.06
Leonard
-0.06
Panther
-0.06
Laure
-0.06
ору
-0.06
?id
-0.06
Všech
-0.06
拥
-0.06
agenta
-0.06
Lu
-0.06
POSITIVE LOGITS
MAP
0.07
upfront
0.06
Dump
0.06
männ
0.06
president
0.06
odd
0.06
eller
0.06
адки
0.06
pen
0.06
发行
0.06
Activations Density 0.001%