INDEX
Negative Logits
CallCheck
-0.07
alse
-0.07
自查
-0.07
_Call
-0.07
ısı
-0.07
院副院长
-0.06
Ramp
-0.06
belum
-0.06
deine
-0.06
friday
-0.06
POSITIVE LOGITS
conceal
0.08
でしょう
0.07
tape
0.07
şek
0.07
şirk
0.07
Sync
0.07
différence
0.07
себе
0.07
образом
0.07
مقارنة
0.07
Activations Density 0.021%