INDEX
Negative Logits
ir
0.45
k
0.45
}
0.42
)
0.41
z
0.39
r
0.39
y
0.38
lardan
0.38
gäng
0.37
Into
0.37
POSITIVE LOGITS
O
0.61
be
0.54
inoltre
0.54
д
0.54
can
0.52
С
0.50
יה
0.50
I
0.49
е
0.47
Т
0.46
Activations Density 0.552%
ir
k
}
)
z
r
y
lardan
gäng
Into
O
be
inoltre
д
can
С
יה
I
е
Т