|
- Mots Clés
Traitement de
documents multimédia,
ondelettes, réseaux de
neurones, réseaux
d'ondelettes, analyse de
documents multimédia,
maillage 3D, analyse
multirésolution,
tatouage,
indexation,
détection de visages,
reconnaissance de
visages, classification,
approximation,
annotation de l'émotion,
apprentissage
automatique.
- Thèmes de
Recherche Actuels
-
Approximation 1D, 2D and
3D
- codage
géométrique de maillage
surfacique 3D
multirésolution
-
Quantification par les
réseaux réguliers de
points pour l'indexation
des images
-
Classification d'images
par réseaux d'ondelettes
-
Reconnaissance faciale
3D par réseaux
d'ondelettes
-
Modélisation faciales 3D
par les images de
profondeur
-
Extraction de
connaissances et
apprentissage
automatique dans les
vidéos
-
Détection, extraction et
annotation des émotions,
- Tatouage
de la parole dans les
domaines transformés
- Modèle
psycho-acoustique pour
le tatouage de documents
multimédias
- Images
mosaïques et détection
d'ombre pour le tatouage
de la vidéo
- Résumé
Synthétique de mes
activités de Recherche
Mon domaine
d’activité est le
traitement de signal
appliqué au son, à
l’image et à la vidéo.
Mes travaux de recherche
portent essentiellement
sur l’utilisation des
ondelettes et réseaux
d’ondelettes en
traitement et analyse
des documents
multimédia.
Parmi les
points forts de mes
activités de recherche,
je peux souligner
l’étude et la mise en
place d’une nouvelle
famille d’ondelettes
paramétrables appelées
ondelettes Bêta. La
fonction Bêta est une
fonction caractérisée
par quatre paramètres :
deux paramètres d’ordre
qui sont p et q, et deux
paramètres x0
et x1
définissant le support
de variation de la
fonction.
Ces travaux de
recherche ont abouti à
la mise en place d’une
nouvelle famille
d’ondelettes Bêta
vérifiant les propriétés
de mères d’ondelettes.
Nous avons pu montrer
que les dérivées de la
fonction Bêta sont des
ondelettes et que les
fonctions d’échelle
d’ordre n ne sont que
les dérivées d’ordre
(n-1) de cette fonction
Bêta. Outre les
paramètres classiques de
translation et de
dilatation, ces
ondelettes Bêta peuvent
être ajustées à travers
les quatre paramètres p,
q, x0 et x1.
Des ondelettes
orthogonales et
biorthogonales ont été
présentées et une
procédure de calcul des
coefficients de filtres
a été détaillée. Des
algorithmes de calcul de
coefficients de filtres
à reconstruction exacte
pour ces ondelettes ont
été implémentés et des
prototypes en Matlab et
Java ont été développés
et testés.
Les premiers
résultats de nos
activités de recherche
ont été élaborés pour
approximer une variante
d’ondelettes connues
comme celles de Haar,
Morlet et des ondelettes
gaussiennes.
L’approximation reste à
ce stade grossière avec
des erreurs
d’approximation dues essentiellement
aux choix heuristiques
des quatre paramètres p,
q, x0 et x1.
Ces premiers
résultats ont été le
point de départ pour
approfondir l’étude
théorique sur ces
ondelettes et de valider
par la suite nos
algorithmes ainsi
développés dans le cas
de la compression
d’images et bien
d’autres applications.
Nous avons montré que
nos ondelettes bêta sont
très compétitives
comparées à une variante
d’ondelettes assez
connues en terme de
concentration d’énergie,
de taux de compression
et de PSNR.
Ces mêmes
ondelettes ont été
utilisées pour des
applications
d’indexation d’images et
de détection des points
d’intérêt. Les résultats
ainsi obtenus ont montré
la supériorité d’une
classe d’ondelettes Bêta
dans plusieurs cas de
figures comparée à
quelque unes des
ondelettes les plus
connues dans le monde de
la recherche et les plus
utilisées dans ce type
d’applications.
Néanmoins, tous les
résultats de ces
traitements confirment
la sensibilité du choix
des paramètres p, q, x0
et x1. Ces
paramètres, ajustés par
des méthodes itératives
pour le moment,
nécessitent d’autres
études d’optimisation
pour maximiser la
concentration d’énergie
dans l’espace des
ondelettes et contribuer
au choix de la meilleure
ondelette pour un
meilleur traitement
donné. Des travaux de
recherche ont déjà été
lancés pour palier à ces
contraintes.
Comme deuxième
grande partie de mes
activités de recherche,
nous avons fait un
rapprochement entre les
réseaux de neurones et
les réseaux
d’ondelettes. En partant
des travaux élaborés sur
les ondelettes Bêta,
nous avons aussi mis en
place des architectures
de réseaux de neurones
utilisant soit les
coefficients de ces
ondelettes comme entrées
des neurones du réseau
soit les ondelettes Bêta
pour remplacer les
fonctions usuelles
d’activation au niveau
des neurones de la
couche cachée. Cette
analyse a donné lieu à
des architectures de
réseaux appelées réseaux
d’ondelettes Bêta.
Ces derniers
ont été testés dans des
applications de synthèse
de filtres,
d’approximation de
fonctions, et de
reconnaissance de
formes. D’autres travaux
ont été lancés aussi
pour les tester dans des
applications de
cryptage, de tatouage et
de reconnaissance de
visages.
A ce stade,
nous pouvons confirmer
que nos recherches ont
abouti aux résultats
très intéressants
suivants :
-
Le
premier résultat dégagé
est la capacité
d’approximation
universelle de cette
nouvelle famille de
réseaux d’ondelettes
Bêta.
-
Le
deuxième résultat a
confirmé la supériorité
de nos réseaux
d’ondelettes Bêta dans
l’approximation des
fonctions 1D, 2D et 3D.
-
Le
troisième résultat
montre que les réseaux
d’ondelettes peuvent
être utilisés pour la
synthèse et le calcul
des coefficients de
filtres des ondelettes.
-
Le
Quatrième résultat s’est
manifesté dans les forts
taux de reconnaissance
obtenus pour des
applications de
reconnaissance de
visages.
Les résultats
forts intéressants que
nous avons obtenus avec
les ondelettes et
réseaux d’ondelettes
Bêta, nous ont amené à
essayer de prévoir une
série de tests sur des
images 3D. Un nouvel axe
de recherche a été
abordé, il concerne la
compression de maillages
multirésolutions 3D.
Cette nouvelle
application se fait en
collaboration avec le
laboratoire I3S de Nice
Sophia Antipolis. Elle
consiste à subdiviser
les objets à traiter en
maillages
multirésolutions et à
optimiser le temps de
chargement et de
traitement de ces
mailles pour des
applications de
compression et de
transmission progressive
sur les réseaux de
communication.
L’approximation 3D de
ces formes consistera à
avoir une représentation
plus compacte et plus
fidèle de l’objet.
Avec le
laboratoire I3S de Nice
Sophia Antipolis, nous
travaillons aussi sur
l’indexation des images
par le biais d’un
ensemble de
descripteurs, liés à la
couleur, à la forme et à
la texture, en faisant
intervenir en partie la
notion de lattices
emboîtées, la
quantification
vectorielle et les
résultats de nos
recherches sur les
ondelettes et réseaux
d’ondelettes Bêta.
D’autres pistes
de recherche ont été
dégagées pour étudier
les problèmes de
cryptage, de tatouage,
et d’indexation d’images
et de vidéos en
exploitant d’une part
les points forts de la
théorie des ondelettes
et d’une autre part les
résultats obtenus avec
la nouvelle famille
d’ondelettes et de
réseaux d’ondelettes
paramétrables Bêta.
Avec l’équipe
LABRI de l’université
Bordeaux1, nous avons
déjà lancé un ensemble
de travaux de recherche
sur le tatouage du son,
d’images et de vidéos en
jouant sur les zones
d’ombre dans les images
et sur les images clés
dans les séquences
vidéos en vue des
applications de
préservation de droits
d’auteur et d’indexation
des données multimédia.
Avec les
équipes LIFL de
l’université de Lille 1
et LIRIS de l’Ecole
Centrale de Lyon, nous
avons abordé un autre
axe de recherche qui
traite les aspects de
reconnaissances de
visages 3D en utilisant
les courbes géodésiques
et ce pour des
applications de
reconnaissance,
d’identification et de
classification de
visages 3D.
- Bilan
Scientifique
Papiers
publiés dans des
livres, revues
internationales et
journaux scientifiques
(24 articles) :
-
23
articles
publiés.
-
1 chapitre de
livre publié.
- 1 chapitre de
livre à paraître.
-
7 articles
soumis
Papiers
publiés dans des
conférences
internationales avec
comités de lecture (95
papiers):
-
95 papiers publiés.
-
3 papiers à
paraître.
-
5 papiers soumis.
Etudiants
encadrés en Mastère et
en thèse :
-
44 étudiant(e)s
en mastère de recherche
(dont 38
soutenus).
-
9 étudiant(e)s
inscrits en thèse à
l’ENIS (dont 5
soutenus).
-
4 étudiant(e)s
inscrits en thèse en
cotutelle (dont 3
soutenus).
-
2 étudiant(e)s
inscrits en thèse en
codirection (dont 1
soutenu).
- Résumé de
Recherche au REGIM (à
partir de 2000)
Le REGIM
(Groupe de
REcherche sur les
Machines
Intelligentes)
Le REGIM
"Groupe de Recherche sur
les
Machines Intelligentes"
a été fondé en
Janvier 1997 sous le
code DGRST E15/C14 et a
été renouvelé sous le
code DGRST 01/UR/11-02,
situé à l’École
Nationale d’Ingénieurs
de Sfax - Université de
Sfax, sous la direction
du Professeur Adel
Mohamed ALIMI.
Les activités
de recherche
du REGIM tournent autour
de la recherche et le
développement de
l'Intelligence des
Machines. Le cycle de
vie d'une machine
intelligente s'étend sur
quatre principaux
processus intelligents
que la nature a inventés
pour assurer la survie
des êtres vivants la
modélisation,
l'apprentissage, le
développement et
l'évolution. Toutefois,
alors que ces processus
sont souvent étudiés
isolément les uns des
autres, le REGIM cherche
à comprendre et à
exploiter leurs
synergies. En
particulier, des
techniques intelligentes
sont combinées pour
mettre au point des
contrôleurs qui savent
reconnaître des
manuscrits, qui savent
analyser des données
multimédias, qui peuvent
bouger et coopérer pour
accomplir une tâche
commune.
Les principales
techniques intelligentes
utilisées par les
membres du REGIM sont :
les réseaux de neurones,
la logique floue, les
ondelettes et les
algorithmes
évolutionnistes inspirés
de la biologie (A.
génétiques, A. de
fourmis,...).
Durant les
trois dernières années,
les activités du REGIM
était rassemblées en 3
principales thématiques,
selon le domaine
applicatif :
-
Analyse
et Reconnaissance des
Documents
-
Analyse
et Traitement
Intelligent des
Données
Multimédias
-
Modélisation
et Contrôle Intelligent
des systèmes robotisés
L’axe 2 :
Analyse et
Traitement
Intelligent des
Données
multimédias
L’équipe Analyse
et Traitement
Intelligent des Données
Multimédias dont je fais
partie consacre ses axes
d’intérêts sur la
productique (domaine qui
a débuté avec mes
travaux de DEA et de
Thèse et qui a continué
en collaboration avec
l’équipe CEREP de
l’Ecole Supérieure des
Sciences et Techniques
de TUNIS) et sur les
Nouvelles Techniques
d’Information et de
Communication (NTIC).
Dans l’axe
productique, nous
continuons à travailler
sur la coopération
Robot/Vision et plus
particulièrement sur
l’asservissement visuel
des robots pour les
applications médicales.
Dans le deuxième
axe NTIC, nous avons
travaillé sur une
nouvelle famille
d’ondelettes
paramétrables basée sur
une fonction appelée
Bêta. Nous avons pu
démontrer que les
dérivées nième de cette
fonction sont des
ondelettes mères ayant
chacune comme fonction
d’échelle la dérivée
(n-1)ème de
la fonction Bêta. Un
nouveau théorème a été
énoncé et démontré pour
confirmer ce résultat.
Suite à cet
aboutissement et pour
valider nos résultats
théoriques, nous avons
choisi d’implémenter ces
ondelettes et de les
tester dans plusieurs
exemples d’application :
-
Analyse
multirésolution des
images
-
compression
et débruitage d’images
-
recherche
des points d’intérêt
dans les images
-
indexation
des images
Les résultats
ainsi obtenus ont montré
la compétitivité de
cette famille
d’ondelettes Bêta et sa
supériorité dans
plusieurs cas de figures
comparée à quelque unes
des ondelettes les plus
connues dans le monde de
la recherche.
En partant de ces
travaux élaborés sur les
ondelettes Bêta, nous
avons aussi mis en place
des architectures de
réseaux de neurones
utilisant soit les
coefficients de ces
ondelettes comme entrées
des neurones du réseau
soit les ondelettes Bêta
pour remplacer les
fonctions usuelles au
niveau des neurones de
la couche cachée. Cette
analyse a donné lieu à
des architectures de
réseaux appelés réseaux
d’ondelettes Bêta.
Ces derniers ont
été déjà testés dans des
applications de synthèse
de filtres,
d’approximation de
fonctions, et de
reconnaissance de
formes. D’autres travaux
sont actuellement lancés
pour tester ces réseaux
d’ondelettes Bêta dans
des applications de
cryptage, de tatouage
d’images et de vidéos,
et dans des applications
de reconnaissance de
visages.
Toujours fondées
sur l’utilisation des
ondelettes et des
analyses
multirésolutions, nos
recherches s’étendent
actuellement aux
domaines de la
représentation des
objets 3D par les
maillages géométriques
multirésolutions 3D. Le
traitement se ramène du
niveau pixel au niveau
géométrie des points et
des mailles 3D. Comme
applications de ces
approches, nous avons
choisi le codage et la
compression dans un
schéma général d'une
chaîne de transmission
progressive des objets
et vidéos 3D sur les
réseaux Internet.
- Activité de
Recherche à l’ESSTT
(de 1995 à 2000)
Le CEntre
de REcherche en
Productique
(CEREP)
Les activités de
recherche au sein du
CEREP (laboratoire
implanté à l’Ecole
Supérieure des Sciences
et Techniques de Tunis)
ont pour objet
l’Automatisation des
systèmes de production
et de leur
environnement. Afin de
réaliser ces objectifs
de recherche, tant sur
les aspects
méthodologiques que sur
le plan applicatif, les
chercheurs du CEREP sont
organisés en six
équipes :
-
Equipe
Traitement du signal et
de l’image
-
Equipe
Production et
Mécatronique
-
Equipe
Sûreté de fonctionnement
-
Equipe
Supervision des systèmes
automatisés de
production
-
Equipe
Electronique de
puissance et commande
des machines
-
Equipe
Modélisation, Simulation
et Commande
L’équipe
de Traitement de
signal et Images du
CEREP
Les activités
de recherche au sein de
cette équipe dont je
fais partie, ont pour
objectifs :
-
Pour
te traitement d'images :
L’analyse, le
traitement, la
reconnaissance et le
contrôle dimensionnel
d’objets destinés à être
manipulés par des robots
industriels
-
Pour
le Traitement du
signal : L’exploitation
des méthodes neuronales
pour le filtrage des
systèmes linéaires et
non linéaires.
- Activité de
Recherche au LAMII
« Laboratoire
d’Automatique, de
Micro-électronique et
d’Informatique
Industrielle
d’ANNECY-France » (de
1994 à 1995)
La simulation
numérique des procédés
d'emboutissage et de
formage nécessite pour
être plus proche de la
réalité des critères qui
permettent de détecter
les phénomènes des
strictions caractérisés,
en phase finale, par un
déchirement de la
matière. Le but est
d'élaborer un protocole
expérimental fiable et
reproductible pour la
détermination des
courbes limites de
formage en contraintes
qui représentent un des
critères les plus
fiables actuellement
pour la détection des
strictions.
Pour parvenir à
cet objectif, l'étude
demandée repose sur
l'élaboration d'un
logiciel d'analyse
d'images et
d'interprétation des
mesures en temps réel,
afin de contrôler le
procédé de formage et
d'en tirer les points
expérimentaux
indispensables à la
détermination des
courbes limites.
L'acquisition d'images
est assurée par une
caméra numérique à très
haute définition et le
traitement par un
micro-ordinateur de type
PC.
Le logiciel
doit permettre de :
-
calculer
les déformations
rationnelles,
-
calculer
les directions
principales de
déformation,
-
afficher
le graphe des
déformations Le long
d'une ligne donnée,
-
déterminer
les déformations
correspondant à
l'apparition de la
striction suivant un
critère donné.
- Activité de
Recherche en Thèse (de
1990 à 1994)
Simuler les
procédés de production,
dès leur conception,
présente des avantages
qui apparaissent chaque
jour plus intéressants,
du fait des économies
engendrées : gain de
temps,
non-immobilisation de
l'outil de production,
optimisation de
l'investissement, etc...
Les logiciels
disponibles, tout
performants qu'ils
soient, pêchent
cependant par un manque
notable concernant la
simulation réaliste de
capteurs évolués. Il est
toujours possible de
placer des capteurs tout
ou rien, voire des
capteurs de proximités
analogiques, mais il est
généralement impossible
de simuler des capteurs
tels que des caméras.
Pourtant, la simulation
de ceux-ci apporterait
une aide importante lors
de la conception de
postes de travail
comportant de la vision.
Cette lacune est encore
plus manifeste vis-à-vis
des systèmes de vision
industriels, pourtant de
plus en plus utilisés
sur les chaînes de
production pour le
contrôle‑qualité et/ou
pour l'identification
des pièces en cours
d'approvisionnement ou
de fabrication.
C'est pour
pallier cette
insuffisance que nous
proposons un simulateur
de capteurs complexes,
tels que les caméras
CCD, qui permet
d'obtenir des images
d'objets ou de scènes
virtuelles. Ces images,
très proches de la
réalité, peuvent être
alors utilisées pour
simuler, par exemple,
une tâche de
reconnaissance de formes
ou une tâche de contrôle
dimensionnel ; la
fonction de ce nouvel
outil est absolument
nécessaire pour la
simulation d'un poste de
contrôle‑Vision et
autorise la
programmation hors-ligne
de celui-ci.
Ce résultat
acquis, on constate que
pour parfaire cet outil
il convient de se
préoccuper également du
choix de la position de
la caméra dans le poste
de travail ; choix qui
n'est pas évident, car
devant tenir compte des
problèmes de champ de
vision, de résolution,
de mise au point,
d'éclairage, de
collision, etc... C'est
pour cette raison que
notre proposition
associe à la simulation
une méthode de placement
automatique de caméra.
L'ensemble de
modélisation et de
placement automatique de
capteurs Vision
constitue un poste
virtuel de Vision, qui
peut valablement être
intégré à un système de
CAO Robotique, afin de
disposer d'un outil
complet de simulation de
tâches faisant appel à
des robots et à des
systèmes de vision. Ce
module Vision est validé
par la description de
deux applications, l'une
dans l'optique contrôle,
l'autre dans un
processus d'assemblage
robotisé.
- Activité de
Recherche en DEA (de
1989 à 1990)
Le sujet de
recherche de mon DEA
s'intitule
"Programmation
Hors-Ligne. Application
au contrôle
dimensionnel". Il aborde
le problème de
l'intégration de la CAO
dans les systèmes de
vision et les
améliorations qu'elle
peut apporter dans
plusieurs domaines de
l'industrie.
Jusqu'à
maintenant la CAO était
utilisée pour des tâches
de programmation des
machines à commande
numérique, de simulation
et parfois pour
concevoir, programmer et
simuler des postes de
travail robotisés. Se
pose alors le problème
de trouver une technique
qui permette
l'interconnexion
CAO-Vision et d'essayer
d'avoir la même
flexibilité pour les
systèmes de vision que
les machines à commande
numérique ou les robots
industriels. C'est
l'objet du travail
présenté dans mon DEA.
Ces systèmes de vision
ont besoin en mémoire
d'un modèle de référence
(paramétrique ou
dimensionnel). Ce modèle
se construit en
présentant sous la
caméra les
objets et en calculant à
partir des contours un
certain nombre de
paramètres. Ce tpye
d'apprentissage est lent
et nécessite une
présence obligatoire sur
site. Il immobilise la
chaîne de production
après chaque
modification ou
introduction d'un
nouveau paramètre dans
l'apprentissage. En plus
il manipule des contours
issus d'images
binarisées et qui
dépendent fortement de
la chaîne d'acquisition
d'images (capteurs,
optiques, convertisseur,
etc...) et des
conditions d'éclairage
de la scène.
La solution
proposée était de
changer ce type
d'apprentissage en
utilisant la
programmation
hors-ligne. Cette
dernière va assurer
l'interconnexion
CAO-Vision en créant le
modèle de référence des
pièces sur une station
de travail, en simulant
la phase de contrôle
dimensionnel, en
transférant les
caractéristiques de ces
pièces vers le système
de vision et en mettant
à jour les fichiers
vision après chaque
modification faite dans
la base de données. Il
en résulte que la
production ne va plus
être arrêtée pour
reprogrammer les
machines et refaire ou
modifier l'apprentissage
des pièces.
|