INDEX
Negative Logits
偏
-0.08
ziale
-0.08
automation
-0.08
בב
-0.07
inspection
-0.07
Inspection
-0.07
.bias
-0.07
regimes
-0.07
ความคิดเห็น
-0.07
지난
-0.07
POSITIVE LOGITS
miroir
0.08
espejo
0.08
obt
0.08
Ya
0.08
ya
0.08
Nou
0.08
eun
0.08
Ya
0.07
yo
0.07
曰
0.07
Activations Density 0.008%