INDEX
Negative Logits
overst
-0.08
atement
-0.07
Bug
-0.07
chang
-0.07
Twe
-0.07
.export
-0.07
suicide
-0.07
starving
-0.07
rape
-0.07
slechte
-0.07
POSITIVE LOGITS
evokes
0.12
想到
0.11
évo
0.11
asociado
0.10
imediatamente
0.09
associado
0.09
evoke
0.09
invokes
0.09
immediately
0.09
imagery
0.09
Activations Density 0.038%