INDEX
Negative Logits
Food
-0.07
hiking
-0.07
ега
-0.06
균
-0.06
Actress
-0.06
avi
-0.06
ibia
-0.06
แนะ
-0.06
combining
-0.06
haired
-0.06
POSITIVE LOGITS
̣c
0.07
(_.
0.07
plag
0.06
发展
0.06
crawl
0.06
управління
0.06
toddler
0.06
Cou
0.06
gnu
0.06
↵ ↵
0.06
Activations Density 0.022%