INDEX
Explanations
This neuron activates on French-language words or phrases.
New Auto-Interp
Negative Logits
Expand
-0.07
=new
-0.06
=test
-0.06
Пред
-0.06
554
-0.06
765
-0.06
объект
-0.06
kiego
-0.06
_favorite
-0.06
af
-0.06
POSITIVE LOGITS
Ancient
0.06
.AWS
0.06
describing
0.06
Routes
0.06
ポイント
0.06
sembler
0.06
adventures
0.06
taxpayer
0.06
zend
0.06
gmail
0.06
Activations Density 0.060%