INDEX
Explanations
Taiwan or Taiwanese entities
New Auto-Interp
Negative Logits
Debugging
0.52
İslam
0.48
边界
0.47
Spice
0.46
辊
0.46
Nub
0.45
לת
0.44
रूसी
0.44
Boundary
0.44
Boundary
0.43
POSITIVE LOGITS
Taiwan
1.91
Taiwan
1.78
Taiwanese
1.78
台湾
1.73
taiwan
1.60
Taipei
1.59
台北
1.51
台灣
1.42
Đài
1.30
臺灣
1.20
Activations Density 0.018%