INDEX
Negative Logits
Geek
-0.06
idiots
-0.06
Providing
-0.06
již
-0.06
st
-0.06
Hen
-0.06
controlled
-0.06
ніби
-0.06
Provid
-0.06
اطعة
-0.06
POSITIVE LOGITS
}()↵
0.07
!"
0.07
리
0.07
_invoke
0.06
گفت
0.06
cite
0.06
(criteria
0.06
Investigators
0.06
hateful
0.06
}",↵
0.06
Activations Density 0.000%