INDEX
Negative Logits
theoret
-0.07
physi
-0.07
mev
-0.07
theoretically
-0.07
reaction
-0.07
silloin
-0.07
理论
-0.07
_since
-0.07
Auckland
-0.07
weiterhin
-0.07
POSITIVE LOGITS
दम
0.10
amál
0.09
گیری
0.08
chewy
0.08
andaş
0.08
��
0.08
선언
0.08
Statement
0.08
"ד
0.08
<|end|>
0.08
Activations Density 0.051%