INDEX
Negative Logits
dam
-0.08
fyrr
-0.08
cái
-0.08
puissent
-0.08
ार्थ
-0.08
Abstand
-0.07
beveilig
-0.07
proportions
-0.07
फ
-0.07
ydy
-0.07
POSITIVE LOGITS
footsteps
0.09
aches
0.08
hills
0.07
aloud
0.07
裂
0.07
muscular
0.07
terg
0.07
simmer
0.07
quil
0.07
omin
0.07
Activations Density 0.003%