INDEX
Negative Logits
exceeds
0.58
являются
0.53
takes
0.50
performs
0.49
நான்
0.49
असतात
0.49
applies
0.49
வருகின்றனர்
0.48
enjoys
0.47
ఉంటాయి
0.47
POSITIVE LOGITS
zelf
0.81
نے
0.52
persönlich
0.47
ths
0.45
лично
0.44
hätte
0.44
klich
0.42
habl
0.41
zący
0.41
glu
0.40
Activations Density 0.005%