INDEX
Negative Logits
domicilio
0.42
подозре
0.40
valour
0.39
udges
0.38
HintPath
0.38
prestige
0.38
unproductive
0.38
звуча
0.37
deont
0.37
revenge
0.37
POSITIVE LOGITS
scut
0.46
ፒ
0.46
র্ব
0.45
λάβ
0.43
уро
0.42
ј
0.42
爌
0.41
亰
0.41
frameN
0.40
乌
0.40
Activations Density 0.001%