INDEX
Negative Logits
வழ
-0.08
ofere
-0.08
Harris
-0.07
willingness
-0.07
directs
-0.07
käs
-0.07
fellowship
-0.07
_SKIP
-0.07
мере
-0.07
parem
-0.07
POSITIVE LOGITS
juist
0.09
osv
0.08
goth
0.08
0.08
кого
0.08
watercolor
0.08
grab
0.08
Opacity
0.08
)?
0.08
fuese
0.08
Activations Density 0.024%