INDEX
Negative Logits
游客
-0.08
-worker
-0.07
quare
-0.07
狗
-0.07
犬
-0.07
리
-0.07
-workers
-0.07
어난
-0.07
incub
-0.07
diagon
-0.07
POSITIVE LOGITS
JUL
0.08
متن
0.08
ód
0.08
ədə
0.08
laj
0.08
subplot
0.08
gummies
0.08
xxxxx
0.08
//=
0.08
glitter
0.08
Activations Density 0.001%