INDEX
Negative Logits
mattresses
-0.08
retains
-0.08
년
-0.08
excuse
-0.07
비
-0.07
Retention
-0.07
Voice
-0.07
�
-0.07
年
-0.07
-ret
-0.07
POSITIVE LOGITS
catal
0.09
قيام
0.08
সম্ভ
0.08
èce
0.08
Clark
0.08
участие
0.08
destructive
0.08
OH
0.08
অভিযান
0.08
हमला
0.08
Activations Density 0.005%