INDEX
Negative Logits
л
0.66
glare
0.64
herzlich
0.57
”،
0.57
sizzling
0.57
లు
0.56
ב
0.56
sprach
0.56
ობას
0.55
ों
0.54
POSITIVE LOGITS
W
0.84
X
0.81
ST
0.80
K
0.80
SA
0.79
Y
0.79
B
0.75
DE
0.74
Q
0.73
T
0.72
Activations Density 0.008%
л
glare
herzlich
”،
sizzling
లు
ב
sprach
ობას
ों
W
X
ST
K
SA
Y
B
DE
Q
T