INDEX
Negative Logits
-Ta
-0.09
டை
-0.08
Heads
-0.08
Heads
-0.07
kär
-0.07
pada
-0.07
VH
-0.07
auft
-0.07
Svc
-0.07
дын
-0.07
POSITIVE LOGITS
ữ
0.08
ership
0.07
OWN
0.07
着
0.07
Simple
0.07
Rs
0.07
acquisition
0.07
Processor
0.07
dearly
0.07
explo
0.07
Activations Density 0.037%