INDEX
Negative Logits
ו
0.59
V
0.53
Danke
0.52
T
0.52
Superhero
0.50
Wet
0.50
GYPT
0.49
AndDelete
0.49
ק
0.48
X
0.48
POSITIVE LOGITS
τα
0.67
padă
0.57
of
0.55
し
0.54
ayutt
0.54
brimming
0.53
äksi
0.52
ід
0.52
è
0.50
说到
0.50
Activations Density 12.819%