INDEX
Negative Logits
fre
-0.08
Select
-0.08
Friendly
-0.08
selectively
-0.07
Fre
-0.07
Geg
-0.07
Mickey
-0.07
اسلام
-0.07
Sel
-0.07
كر
-0.07
POSITIVE LOGITS
renfor
0.09
(D
0.08
Bar
0.08
Bar
0.08
shall
0.08
permita
0.08
Sap
0.08
াগত
0.08
강화
0.08
बार
0.08
Activations Density 0.011%