INDEX
Negative Logits
Sheikh
-0.08
hanze
-0.07
gad
-0.07
adj
-0.07
паш
-0.07
aparte
-0.07
HD
-0.07
GD
-0.07
_↵
-0.07
烟
-0.07
POSITIVE LOGITS
placebo
0.12
believing
0.12
beliefs
0.11
belief
0.11
percepción
0.10
心理
0.10
воспри
0.10
विश्वास
0.10
morale
0.10
বিশ্বাস
0.10
Activations Density 0.032%