INDEX
Negative Logits
ineuse
0.83
<unused5>
0.82
นักงาน
0.82
homeini
0.81
ôté
0.79
rizione
0.77
ötzlich
0.77
डन
0.76
egli
0.76
pV
0.75
POSITIVE LOGITS
flip
0.83
flip
0.75
Change
0.70
(
0.69
(
0.67
cont
0.67
ंता
0.66
camb
0.65
Flip
0.65
qualifies
0.65
Activations Density 0.010%