INDEX
Explanations
Chinese culture and language
New Auto-Interp
Negative Logits
கிரேக்க
0.81
镑
0.81
🇫
0.80
スペイン
0.78
আফ্রিকার
0.78
Partizan
0.78
班牙
0.76
鎊
0.76
चॉकलेट
0.74
Afrika
0.74
POSITIVE LOGITS
Confucian
1.83
Buddhism
1.71
Buddhist
1.66
Chinese
1.64
Tao
1.61
Qing
1.60
bamboo
1.59
Qin
1.58
Zhang
1.49
Dao
1.49
Activations Density 0.289%