INDEX
Negative Logits
बै
-0.09
sized
-0.08
koll
-0.08
ütt
-0.08
Antarctica
-0.08
ख
-0.07
हित
-0.07
prid
-0.07
vert
-0.07
ढ
-0.07
POSITIVE LOGITS
vows
0.09
roman
0.08
forgiveness
0.08
marital
0.08
Matr
0.07
filed
0.07
gon
0.07
csrf
0.07
_rules
0.07
REFER
0.07
Activations Density 0.003%