INDEX
Negative Logits
TW
-0.08
Tb
-0.07
jib
-0.07
']
-0.07
isable
-0.07
Zwei
-0.07
vom
-0.07
Sullivan
-0.07
cyane
-0.07
SUVs
-0.07
POSITIVE LOGITS
-cultural
0.09
-economic
0.08
olig
0.07
mathematic
0.07
technical
0.07
jargon
0.07
Atlanta
0.07
geometr
0.07
онҳо
0.07
�
0.07
Activations Density 0.053%