INDEX
Explanations
making comparisons or analogies
New Auto-Interp
Negative Logits
เหมาะ
0.41
क्रमण
0.38
Maas
0.37
timevals
0.37
stration
0.37
Aeonium
0.36
வெளி
0.36
Vázquez
0.35
Vás
0.35
))],
0.34
POSITIVE LOGITS
汽车
0.54
automobiles
0.52
자동차
0.52
automobile
0.52
analogous
0.48
plumbing
0.47
airplanes
0.47
автомобилей
0.46
汽車
0.46
其他
0.45
Activations Density 0.131%