INDEX
Negative Logits
opposes
-0.08
çoğu
-0.08
continuous
-0.07
_years
-0.07
familiarity
-0.07
迷信
-0.07
_rates
-0.07
رغم
-0.07
することは
-0.07
QDebug
-0.06
POSITIVE LOGITS
ДЕ
0.07
cast
0.07
SITE
0.06
砾
0.06
_LOCAL
0.06
Part
0.06
ובל
0.06
lin
0.06
expanding
0.06
找出
0.06
Activations Density 0.044%