INDEX
Negative Logits
Radi
-0.06
ılıp
-0.06
TestCategory
-0.06
affid
-0.06
putchar
-0.06
Steps
-0.06
σκευή
-0.06
Java
-0.06
Gun
-0.06
�체
-0.06
POSITIVE LOGITS
تسم
0.07
scalar
0.07
ustria
0.07
jim
0.06
imir
0.06
0.06
954
0.06
lc
0.06
medieval
0.06
ent
0.06
Activations Density 0.020%