INDEX
Negative Logits
_wave
-0.07
-le
-0.07
レ
-0.06
част
-0.06
-di
-0.06
取
-0.06
-AA
-0.06
Čer
-0.06
कम
-0.06
_ms
-0.06
POSITIVE LOGITS
oh
0.38
OH
0.23
Oh
0.10
OH
0.10
oh
0.10
Roh
0.09
"Oh
0.08
noh
0.08
Oh
0.07
“Oh
0.07
Activations Density 0.004%
_wave
-le
レ
част
-di
取
-AA
Čer
कम
_ms
oh
OH
Oh
OH
oh
Roh
"Oh
noh
Oh
“Oh