INDEX
Negative Logits
dresser
0.40
dubious
0.39
pern
0.38
bele
0.37
pensar
0.37
questionable
0.36
perplexed
0.36
puzzling
0.36
frayed
0.36
towel
0.35
POSITIVE LOGITS
často
0.45
обеспечи
0.42
включает
0.42
ofte
0.40
अक्सर
0.40
ovlád
0.39
เหล่านี้
0.39
అనేది
0.39
thường
0.38
зависи
0.38
Activations Density 0.001%