INDEX
Negative Logits
ಲ್ಲಿ
-0.08
Impl
-0.08
�
-0.07
argue
-0.07
قاب
-0.07
با
-0.07
Len
-0.07
money
-0.07
shows
-0.07
Aware
-0.07
POSITIVE LOGITS
事项
0.12
disclaim
0.08
Mariano
0.08
事項
0.07
bahwa
0.07
Georges
0.07
사항
0.07
Cornwall
0.07
rition
0.07
intric
0.07
Activations Density 0.040%