INDEX
Negative Logits
log
0.49
eingesetzt
0.45
overuse
0.44
aus
0.44
intermitt
0.43
de
0.43
střed
0.42
ausführ
0.42
problems
0.42
use
0.41
POSITIVE LOGITS
表示
0.49
regnum
0.43
ненави
0.42
indicating
0.42
payable
0.42
意识到
0.42
newValue
0.41
inį
0.40
nobody
0.39
adien
0.38
Activations Density 0.009%