INDEX
Negative Logits
-0.09
ữ
-0.07
existe
-0.07
ің
-0.07
urations
-0.07
conducive
-0.07
Vertr
-0.07
eignet
-0.07
Kū
-0.07
southern
-0.07
POSITIVE LOGITS
넘어
0.10
విషయ
0.09
الانت
0.09
kolej
0.09
NEXT
0.09
Topic
0.08
vigtig
0.08
ary
0.08
viktig
0.08
Topic
0.08
Activations Density 0.021%