INDEX
Negative Logits
Nun
-0.07
(det
-0.06
quip
-0.06
تفس
-0.06
/ns
-0.06
drivers
-0.06
Draw
-0.06
сут
-0.06
barbar
-0.06
sebeb
-0.06
POSITIVE LOGITS
physically
0.07
WAL
0.07
proud
0.07
-ver
0.06
GSL
0.06
Christopher
0.06
sporting
0.06
cause
0.06
counselor
0.06
ダ
0.06
Activations Density 0.002%