INDEX
Negative Logits
harbors
0.46
脨
0.40
䡋
0.39
harbours
0.37
䛺
0.37
of
0.37
ہری
0.37
藠
0.37
ವಿ
0.36
乆
0.36
POSITIVE LOGITS
2
0.77
3
0.73
0
0.68
9
0.68
1
0.68
5
0.67
4
0.66
8
0.66
7
0.62
6
0.62
Activations Density 2.128%
harbors
脨
䡋
harbours
䛺
of
ہری
藠
ವಿ
乆
2
3
0
9
1
5
4
8
7
6