INDEX
Negative Logits
øj
0.39
ælp
0.38
ække
0.38
Æ
0.37
æk
0.37
forskellige
0.37
ərə
0.36
hulk
0.36
rokken
0.36
Consequences
0.36
POSITIVE LOGITS
mer
0.36
intern
0.35
ide
0.34
ent
0.34
refer
0.33
এতে
0.33
son
0.33
der
0.33
opp
0.32
distrib
0.32
Activations Density 0.002%