INDEX
Negative Logits
surviv
-0.06
contradictory
-0.06
квад
-0.06
contradict
-0.06
니다
-0.06
Shore
-0.06
hir
-0.06
lege
-0.06
retrospect
-0.06
化
-0.06
POSITIVE LOGITS
messaging
0.07
للأ
0.07
valores
0.07
tüm
0.06
START
0.06
Š
0.06
DialogInterface
0.06
ipzig
0.06
Messaging
0.06
qp
0.06
Activations Density 0.023%