INDEX
Negative Logits
Ис
-0.08
яду
-0.08
工作人员
-0.08
러스
-0.08
preis
-0.08
futurs
-0.08
退
-0.07
�
-0.07
pass
-0.07
닷
-0.07
POSITIVE LOGITS
sophistication
0.10
البشر
0.09
Advanced
0.09
Advanced
0.09
الإنسان
0.09
-enabled
0.09
-cap
0.08
Developed
0.08
sophist
0.08
Capability
0.08
Activations Density 0.016%