INDEX
Explanations
phrases indicating observation
New Auto-Interp
Negative Logits
创造
0.79
實現
0.75
創造
0.74
errichtet
0.72
สร้าง
0.71
实现
0.70
实现
0.69
を提供
0.69
制造
0.69
trồng
0.66
POSITIVE LOGITS
melihat
1.14
inspecting
1.11
viewing
1.11
examining
1.11
observe
1.10
observing
1.07
inspection
1.05
观察
1.04
observation
1.02
examine
1.02
Activations Density 0.717%