INDEX
Negative Logits
////////////
-0.07
HELP
-0.07
Grammar
-0.06
,UnityEngine
-0.06
Hard
-0.06
-screen
-0.06
inic
-0.06
Grammar
-0.06
наблюд
-0.06
.Domain
-0.06
POSITIVE LOGITS
petals
0.08
Spl
0.07
تط
0.07
evils
0.06
معل
0.06
(cart
0.06
tarif
0.06
jal
0.06
Rebel
0.06
(features
0.06
Activations Density 0.001%