INDEX
Negative Logits
particular
-0.08
-0.07
@@
-0.07
[
-0.07
chamber
-0.07
стан
-0.07
aben
-0.07
just
-0.07
Moscow
-0.07
Bh
-0.07
POSITIVE LOGITS
Worten
0.11
لغة
0.10
اللغة
0.10
Worte
0.10
языке
0.10
woorden
0.10
ভাষ
0.09
ালি
0.09
tiếng
0.09
찍
0.09
Activations Density 0.002%