INDEX
Negative Logits
Bell
-0.08
观察
-0.07
Observer
-0.07
意味着
-0.07
cautious
-0.07
observer
-0.07
ponder
-0.07
observe
-0.07
Inte
-0.07
Observe
-0.07
POSITIVE LOGITS
hano
0.10
гэн
0.09
הצד
0.09
былі
0.08
ziren
0.08
nyl
0.08
ஆகிய
0.08
kasebut
0.08
babo
0.08
Â
0.08
Activations Density 0.004%