INDEX
Negative Logits
Old
-0.07
šil
-0.06
Appe
-0.06
terminate
-0.06
Hamp
-0.06
separator
-0.06
withd
-0.06
sidelines
-0.06
وان
-0.06
วด
-0.06
POSITIVE LOGITS
Bunun
0.07
possível
0.06
liğin
0.06
@Module
0.06
paněl
0.06
галузі
0.06
んでいる
0.06
nextState
0.06
chatte
0.06
металли
0.06
Activations Density 0.002%