INDEX
Negative Logits
aman
-0.07
segue
-0.07
führung
-0.07
sef
-0.07
ming
-0.07
imbledon
-0.07
भविष्य
-0.07
Several
-0.07
cho
-0.07
Usage
-0.07
POSITIVE LOGITS
Zuh
0.09
bijdrage
0.09
的时候
0.08
gland
0.08
בז
0.08
НР
0.08
irchen
0.08
child's
0.07
jouw
0.07
criterion
0.07
Activations Density 0.010%