INDEX
Negative Logits
irrig
-0.08
Irr
-0.07
_soc
-0.07
MSS
-0.07
Zh
-0.06
Miz
-0.06
Location
-0.06
Doctor
-0.06
(coords
-0.06
इल
-0.06
POSITIVE LOGITS
edin
0.08
proving
0.07
일정
0.07
бит
0.07
ту
0.07
نوع
0.06
이상
0.06
上
0.06
eyi
0.06
ριν
0.06
Activations Density 0.001%