INDEX
Negative Logits
아니
-0.08
vigilance
-0.08
yani
-0.07
것은
-0.07
Ske
-0.07
ودی
-0.07
TRA
-0.07
uds
-0.07
tra
-0.07
ja
-0.07
POSITIVE LOGITS
pumped
0.09
tuned
0.08
peaked
0.08
�
0.07
speaking
0.07
cared
0.07
parlant
0.07
करण
0.07
வே
0.07
deserved
0.07
Activations Density 0.529%