INDEX
Negative Logits
jungle
-0.09
Rh
-0.08
tric
-0.08
Morgan
-0.08
Rh
-0.08
WORD
-0.07
implying
-0.07
countryside
-0.07
varchar
-0.07
ermi
-0.07
POSITIVE LOGITS
起来
0.10
hinzu
0.09
isel
0.08
isjon
0.08
crest
0.08
вместе
0.07
↵ ↵
0.07
て
0.07
artige
0.07
进去
0.07
Activations Density 0.027%