INDEX
Negative Logits
solcher
0.48
Propaganda
0.48
المنت
0.45
arbeiten
0.43
دیگر
0.42
その他の
0.42
Ventilation
0.42
ังหวัด
0.41
हेमंत
0.41
کاربران
0.41
POSITIVE LOGITS
到
0.40
escape
0.39
流程
0.38
cmd
0.38
逃
0.38
lose
0.37
运算符
0.37
subs
0.37
ôm
0.37
pizarra
0.36
Activations Density 0.001%