INDEX
Negative Logits
Mitchell
-0.08
encounter
-0.07
CTOR
-0.07
mužů
-0.07
negotiation
-0.07
friendship
-0.07
criptors
-0.07
speeches
-0.07
اجتماع
-0.06
Scott
-0.06
POSITIVE LOGITS
:-
0.12
:-
0.11
.-
0.09
.--
0.09
,-
0.08
:-↵
0.08
=-=-=-=-=-=-=-=-
0.07
:/
0.07
/-
0.07
;-
0.07
Activations Density 0.008%