INDEX
    Explanations

    scientific publications

    New Auto-Interp
    Negative Logits
     Saudis
    -0.07
    zig
    -0.07
    obre
    -0.07
    מינים
    -0.06
    -details
    -0.06
    'e
    -0.06
    pokemon
    -0.06
    elsea
    -0.06
    斯特
    -0.06
    -0.06
    POSITIVE LOGITS
    	        	
    0.09
     glass
    0.08
    0.08
     kissing
    0.07
    按摩
    0.07
    קל
    0.07
    0.07
    0.07
    LatLng
    0.07
    Չ
    0.07
    Act Density 0.033%

    No Known Activations