INDEX
Negative Logits
опас
-0.07
fodder
-0.07
Lud
-0.07
Indians
-0.07
Vanilla
-0.06
oje
-0.06
statistically
-0.06
Policy
-0.06
renowned
-0.06
.Source
-0.06
POSITIVE LOGITS
となり
0.07
=a
0.06
。」
0.06
لت
0.06
。</
0.06
"]),
0.06
.news
0.06
σαν
0.06
"><
0.06
らない
0.06
Activations Density 0.055%