INDEX
Negative Logits
ship
-0.08
ço
-0.08
agues
-0.07
seudo
-0.07
fear
-0.07
ships
-0.07
zwar
-0.07
đoàn
-0.07
540
-0.07
Fear
-0.07
POSITIVE LOGITS
一下
0.10
Correspond
0.08
Against
0.08
Macros
0.07
Sei
0.07
себя
0.07
п
0.07
Dominion
0.07
antip
0.07
_outer
0.07
Activations Density 0.015%