INDEX
Negative Logits
Fault
-0.07
397
-0.07
spies
-0.07
77
-0.06
свя
-0.06
smo
-0.06
�i
-0.06
Sciences
-0.06
slate
-0.06
_ComCallableWrapper
-0.06
POSITIVE LOGITS
Enter
0.11
enter
0.10
Enter
0.10
enter
0.10
ter
0.08
.ver
0.08
er
0.08
embodied
0.07
↵
0.07
car
0.07
Activations Density 0.005%