INDEX
Negative Logits
område
-0.08
området
-0.08
ACC
-0.08
缓
-0.08
Proposed
-0.08
Nue
-0.07
Applicable
-0.07
Libro
-0.07
-Step
-0.07
آرام
-0.07
POSITIVE LOGITS
fooled
0.09
recognize
0.09
glance
0.08
distingu
0.08
trivial
0.08
onsense
0.08
очевид
0.08
มือ
0.08
基本
0.08
ви
0.08
Activations Density 0.060%