INDEX
Negative Logits
messageId
-0.07
أفلام
-0.07
,J
-0.07
inappropriate
-0.07
,P
-0.07
圃
-0.06
scratch
-0.06
吵架
-0.06
Emotional
-0.06
script
-0.06
POSITIVE LOGITS
亡
0.07
⎓
0.07
寂
0.07
ẑ
0.07
orias
0.07
�
0.07
ώ
0.06
Stout
0.06
待ち
0.06
'utilisateur
0.06
Activations Density 0.001%