INDEX
Negative Logits
.Dispose
-0.07
.basic
-0.07
đóng
-0.07
Blank
-0.06
Au
-0.06
tomatoes
-0.06
Adjust
-0.06
Two
-0.06
никами
-0.06
이번
-0.06
POSITIVE LOGITS
excuses
0.06
activist
0.06
Sean
0.06
dle
0.06
gte
0.06
ki
0.06
OMP
0.06
مربوط
0.06
aber
0.06
Glow
0.06
Activations Density 0.093%