Imaginons deux sources ponctuelles de caractéristiques identiques d’un point de vue de la perception de l’auditeur, en termes de spectre et de pression acoustique, mais à des distances différentes de l’auditeur [fig. A]. Choisissons la source S1 deux fois plus éloignée de l’auditeur que S2 et la pression acoustique de S2 supérieure de 6 dB à celle de S1 pour compenser l’éloignement. Comment le cerveau va-t-il interpréter la situation ? Va-t-il imaginer une source fantôme Sf [fig. B], résultant de l’agrégation de S1 et S2 et la situer à mi-distance entre les deux ? Ce serait compter sans l’autre paramètre qui entre en jeu ; la variable temporelle. Le temps t1 que met le son de la source S1 pour parvenir à l’auditeur est deux fois supérieur au temps t2 correspondant à S2 [fig. C]. Le son de S2 parvenant à l’auditeur en premier, on l’appelle le premier front d’onde. Et ce premier front d’onde perçu par le cerveau va avoir une grosse influence sur la localisation du son. Cette information va prendre le dessus sur toutes les autres et considérer qu’une seule source existe, et qu’elle est localisée dans la direction de S2.

Les limites du phénomène

Une première limite est atteinte si la différence de temps Δt = t1 – t2 est supérieure à environ 50 ms. L’oreille discrimine alors les deux sources et perçoit S2 dans sa direction propre, puis S1 en écho, aussi dans sa direction. A l’inverse, lorsque la différence de temps est très faible, environ inférieure à 600 µs, le cerveau réalise une localisation de sommation et crée l’image fantôme de la fig. B. C’est le principe de nos systèmes d’écoute stéréo, lorsqu’ils sont correctement mis en place, pour répartir les sources sur le plan frontal entre les haut-parleurs en autant d’images fantômes.