INDEX
Negative Logits
mechanisms
-0.09
wearable
-0.08
ර
-0.08
都是
-0.07
recommande
-0.07
Capitol
-0.07
warme
-0.07
Kons
-0.07
机制
-0.07
embodied
-0.07
POSITIVE LOGITS
yness
0.08
ومح
0.08
بمن
0.08
वी
0.07
game
0.07
א
0.07
איל
0.07
yil
0.07
Three
0.07
minors
0.07
Activations Density 0.009%