INDEX
Negative Logits
.Un
-0.07
düz
-0.07
üyor
-0.07
Arnold
-0.07
२०
-0.07
ru
-0.07
iera
-0.07
ur
-0.07
하려
-0.07
Dry
-0.06
POSITIVE LOGITS
[
0.20
[
0.16
'[
0.12
[[
0.12
"[
0.12
([
0.11
_[
0.11
:[
0.11
{[0.11
>[
0.11
Activations Density 0.154%
.Un
düz
üyor
Arnold
२०
ru
iera
ur
하려
Dry
[
[
'[
[[
"[
([
_[
:[
{[>[