INDEX
Negative Logits
élé
0.42
affron
0.39
Plank
0.38
Saturday
0.37
lick
0.37
Для
0.37
Чтобы
0.37
ellini
0.36
braith
0.36
plank
0.36
POSITIVE LOGITS
নেই
0.52
とし
0.51
とする
0.50
ವಿದೆ
0.49
없는
0.47
조건
0.46
惡
0.46
悪
0.45
duy
0.45
とする
0.44
Activations Density 0.001%