INDEX
Negative Logits
ables
-0.08
(()
-0.08
dap
-0.08
DA
-0.07
declares
-0.07
dreamy
-0.07
mezcla
-0.07
integrating
-0.07
ADV
-0.07
_ADV
-0.07
POSITIVE LOGITS
precedent
0.14
तिहास
0.12
lessons
0.12
历史
0.12
históricos
0.12
historical
0.11
Lessons
0.11
ചരിത്ര
0.11
歴
0.11
Historical
0.11
Activations Density 0.085%