INDEX
Negative Logits
keh
0.41
ケ
0.39
フェ
0.37
嗅
0.37
السكان
0.36
ケ
0.36
Kew
0.35
ке
0.35
㡚
0.35
ቀ
0.34
POSITIVE LOGITS
Dram
0.38
bun
0.37
Mud
0.37
বন্দ্য
0.36
Garland
0.35
martin
0.35
J
0.35
XY
0.35
விரு
0.35
Zhen
0.35
Activations Density 0.006%
keh
ケ
フェ
嗅
السكان
ケ
Kew
ке
㡚
ቀ
Dram
bun
Mud
বন্দ্য
Garland
martin
J
XY
விரு
Zhen