INDEX
Negative Logits
Wat
-0.08
co
-0.08
模
-0.07
橐
-0.07
completed
-0.07
Wat
-0.07
ב
-0.07
璃
-0.07
军人
-0.07
module
-0.07
POSITIVE LOGITS
prank
0.07
�
0.07
spir
0.07
landing
0.07
thrown
0.07
förder
0.07
alignments
0.06
_per
0.06
国土资源
0.06
הטיפול
0.06
Activations Density 0.002%