INDEX
Negative Logits
itſelf
-0.87
مشين
-0.86
faſt
-0.85
snippetHide
-0.82
abetes
-0.81
^(@)
-0.81
Meiji
-0.80
ſeveral
-0.79
Plenum
-0.77
وتسجيلات
-0.77
POSITIVE LOGITS
ir
0.77
Nav
0.73
ino
0.73
Ir
0.72
Ir
0.62
Chat
0.60
nav
0.58
AR
0.56
Chat
0.54
Nav
0.54
Activations Density 0.053%