INDEX
Negative Logits
(active
-0.08
maravil
-0.07
.inverse
-0.07
(join
-0.07
-mini
-0.07
metaphor
-0.07
objectives
-0.07
ದಲ್ಲ
-0.07
breached
-0.07
ಹಿಡ
-0.07
POSITIVE LOGITS
nuta
0.08
swirl
0.08
DPS
0.08
flax
0.08
Nep
0.08
Serr
0.08
Neg
0.08
Ruta
0.08
stampa
0.08
طراحی
0.07
Activations Density 0.001%