INDEX
Negative Logits
scam
-0.09
bully
-0.08
వీ
-0.08
warm
-0.07
goog
-0.07
_TEMPLATE
-0.07
[selected
-0.07
-ca
-0.07
tarn
-0.07
pam
-0.07
POSITIVE LOGITS
प्रक
0.08
מית
0.08
ander
0.08
Fiber
0.08
kos
0.08
MD
0.07
ים
0.07
Fiber
0.07
nature
0.07
volt
0.07
Activations Density 0.005%