INDEX
Negative Logits
Praise
-0.08
glau
-0.07
lok
-0.07
وهو
-0.07
praise
-0.07
事项
-0.07
vooraf
-0.07
Hard
-0.07
yüksək
-0.07
-modern
-0.07
POSITIVE LOGITS
আক
0.09
ఆక
0.08
рес
0.08
exclus
0.08
salvo
0.08
RESA
0.08
hấp
0.07
ज्य
0.07
яли
0.07
resa
0.07
Activations Density 0.024%