INDEX
Negative Logits
Hmm
-0.09
menu
-0.09
Rc
-0.08
Default
-0.08
ABS
-0.07
대해서
-0.07
Mountain
-0.07
Kat
-0.07
Mr
-0.07
Assign
-0.07
POSITIVE LOGITS
handel
0.09
trov
0.09
stranger
0.08
seri
0.08
разработ
0.08
caravan
0.08
体系
0.08
tali
0.08
联
0.08
wett
0.08
Activations Density 0.000%