INDEX
Negative Logits
groundwork
-0.07
ряд
-0.07
Bikini
-0.07
fi
-0.07
arranger
-0.07
letting
-0.07
Maj
-0.07
Vit
-0.07
Tib
-0.07
Vin
-0.07
POSITIVE LOGITS
тр
0.08
Asper
0.08
ACC
0.08
itor
0.07
仁
0.07
burglar
0.07
gie
0.07
편
0.07
犯
0.07
epa
0.07
Activations Density 0.013%