INDEX
Negative Logits
ス
1.05
লা
1.00
ן
0.98
ời
0.95
océano
0.95
くらい
0.95
adaptés
0.95
Questo
0.93
adhipp
0.91
denounce
0.91
POSITIVE LOGITS
n
1.80
ak
1.53
p
1.53
ig
1.41
x
1.37
f
1.33
in
1.30
在
1.27
us
1.26
care
1.23
Activations Density 0.013%
ス
লা
ן
ời
océano
くらい
adaptés
Questo
adhipp
denounce
n
ak
p
ig
x
f
in
在
us
care