INDEX
Negative Logits
Adam
-0.08
Fam
-0.08
monoc
-0.07
조
-0.07
Paged
-0.07
dm
-0.07
-0.07
장의
-0.07
ಗ
-0.07
ડ
-0.07
POSITIVE LOGITS
.visit
0.08
TAN
0.08
Galileo
0.08
객
0.08
vet
0.07
orgen
0.07
Lopez
0.07
oreen
0.07
sırasında
0.07
перем
0.07
Activations Density 0.029%