INDEX
Negative Logits
.shift
-0.08
elerden
-0.07
هست
-0.07
slam
-0.07
.re
-0.07
امید
-0.07
_before
-0.06
候
-0.06
shepherd
-0.06
моз
-0.06
POSITIVE LOGITS
$PostalCodesNL
0.07
�始化
0.07
ーティ
0.06
Barbie
0.06
392
0.06
TIME
0.06
ourse
0.06
IOR
0.06
usterity
0.06
racuse
0.06
Activations Density 0.002%