INDEX
Negative Logits
debuting
0.50
researched
0.49
ujesz
0.48
meestal
0.48
debuted
0.46
dwyd
0.46
informal
0.46
hemian
0.45
क्ट
0.45
osta
0.43
POSITIVE LOGITS
োপ
0.51
работа
0.49
гъ
0.47
持久
0.46
পিং
0.45
ج
0.44
вим
0.44
لر
0.44
ви
0.44
гру
0.43
Activations Density 0.001%