INDEX
Negative Logits
ます
-0.08
Publishing
-0.08
evolved
-0.08
alkal
-0.07
дания
-0.07
curtains
-0.07
Subs
-0.07
ました
-0.07
poderia
-0.07
Subs
-0.07
POSITIVE LOGITS
attacks
0.09
攻击
0.07
Tabla
0.07
Instructor
0.07
Elephant
0.07
seductive
0.07
ARCH
0.07
Pham
0.07
യോഗ
0.07
.Table
0.07
Activations Density 0.020%