INDEX
Negative Logits
warmth
-0.08
kezi
-0.08
warms
-0.08
-through
-0.08
kê
-0.08
kurt
-0.07
прич
-0.07
gling
-0.07
ingly
-0.07
cdr
-0.07
POSITIVE LOGITS
conferences
0.08
/art
0.08
Regents
0.08
ер
0.07
董
0.07
时期
0.07
会议
0.07
leuc
0.07
والاج
0.07
সালের
0.07
Activations Density 0.002%