INDEX
Negative Logits
anha
-0.08
માંથી
-0.08
Hubbard
-0.08
eighty
-0.07
farmhouse
-0.07
Grosso
-0.07
Ty
-0.07
_AN
-0.07
不开
-0.07
kong
-0.07
POSITIVE LOGITS
-benar
0.16
phép
0.09
0.08
بالإ
0.08
James
0.08
nes
0.08
مج
0.07
-looking
0.07
ێ
0.07
পথে
0.07
Activations Density 0.036%