INDEX
Negative Logits
otoxic
-0.08
طف
-0.07
ired
-0.07
.ci
-0.07
TARGET
-0.07
gcc
-0.07
이자
-0.07
AYER
-0.06
EFF
-0.06
费用
-0.06
POSITIVE LOGITS
ament
0.07
assertNotNull
0.07
175
0.07
OMEM
0.06
.Before
0.06
_dictionary
0.06
humanitarian
0.06
Lem
0.06
placeholders
0.06
์ม
0.06
Activations Density 0.001%