INDEX
Negative Logits
tôt
-0.09
fe
-0.09
dg
-0.08
nursing
-0.08
fej
-0.08
episc
-0.08
emi
-0.08
feasibility
-0.07
onnes
-0.07
DG
-0.07
POSITIVE LOGITS
??↵↵
0.09
Anyway
0.09
???↵↵
0.08
blah
0.08
lol
0.08
?↵↵
0.08
()=>
0.08
じゃ
0.08
。所以
0.08
stuff
0.08
Activations Density 0.047%