INDEX
Negative Logits
or
0.52
s
0.52
ü
0.51
are
0.51
л
0.48
ą
0.46
í
0.45
oli
0.42
㮔
0.42
impuestos
0.42
POSITIVE LOGITS
و
0.57
다
0.47
ної
0.41
在
0.41
ي
0.40
ot
0.40
ib
0.39
disorganized
0.38
もら
0.38
다라고
0.38
Activations Density 0.000%
or
s
ü
are
л
ą
í
oli
㮔
impuestos
و
다
ної
在
ي
ot
ib
disorganized
もら
다라고