INDEX
Negative Logits
mismo
0.53
también
0.52
estén
0.49
myös
0.48
misma
0.47
oy
0.46
inflection
0.46
també
0.46
oksatta
0.46
również
0.45
POSITIVE LOGITS
a
0.55
s
0.53
ラ
0.52
L
0.50
Is
0.48
лич
0.47
matched
0.46
o
0.45
coll
0.45
ld
0.44
Activations Density 0.000%