FORMATION
2018 Diplômé du Certificat 'Data Scientist Big Data , Data Sciences' délivré par le laboratoire LAMSADE à l'Université Paris Dauphine
1999 Diplômé de l’école d’Ingénieur Télécoms Paris Sud (ex I.N.T) : Option Signal et Communications Numériques (BAC+5)
1991 Formation d’inspecteur et cadre technique à France Télécom (Lille) (BAC +3)
1988 C.A.P.E.S de Mathématiques (BAC +3)
1987 L3 : Licence de Mécanique à l’Université Paul Sabatier (Toulouse III) (BAC+3)
1985 L2 : DEUG A1 à l’Université Paul Sabatier (Toulouse III) (BAC+2)
1982 BAC C Scientifique au Lycée David d’Angers (Angers)
DOMAINES DE COMPÉTENCES
Connaissances et Pratiques Techniques et Scientifiques :
- Connaissances en traitement du signal, mathématiques appliquées, probabilités et statistiques, transmissions, réseaux et téléinformatique.
- Analyse de données, modélisations mathématiques et statistiques d’analyse des risques.
- Utilisation et analyse de données du système d’information technique Réseaux de France Télécom et de bases de données CNRS en SHS
- Informatique :
*Bureautique : Word, Excel, Power Point, Internet
*Langages de programmation : MATLAB, C, C++,
-Logiciels statistiques : SAS, SPAD, STATA, SPSS, AMOS, R, Latent Gold, M+ : En analyse de Réseaux : GEPHI, UCINET
Relationnel et Enseignement
- Enseignement général secondaire en classe de 2nd, 1er , Terminale
- Formation professionnelle de techniciens et de cadres (France Télécom puis Orange).
- Membre d’un jury de concours, conduites de réunions
- Travail en équipe, présentations, participations ou responsabilités dans des projets, participation aux séminaires statistiques et sociologie
- Formations conceptuelles et pratiques sur logiciels en analyses de données, statistiques , probabilités, mathématiques appliquées en SHS
- Conception et dispense d'Ateliers/Séminaires " gestion et traitement des bases de données et méthodes quantitatives" pour les doctorants
- Conception de formations de sensibilisation technique et éthique a la' Culture Numérique Digitale Big Data Intelligence Artificielle , Algorithmes'
Conduite De projet
- Participation à des plans d’actions et d'évaluations de formations, à des plans d'action d’analyse qualité et projets statistiques en SHS.
EXPÉRIENCE PROFESSIONNELLE
-2007 à ce jour : Ingénieur d’études statistiques CNRS : au CERMES3 (Villejuif
94) , puis à IRISSO et DRM à L'Université Paris Dauphine (Paris 16ème)
-2005-2007 : Cadre expert technique pilote de travaux programmés (France Télécom à Paris 13°, puis Orange à Paris 14°).
-2000-2005 : Cadre expert technique Analyse Qualité Réseaux (France Télécom Paris 14°).
-1999-2000 : Cadre technique soutien Publiphonie (France Télécom Ivry s/Seine).
-1992-1997 : Formateur technique au Service National d’Enseignement de France Télécom (Paris 13°).
-1989-1990 : Professeur certifié titulaire en Mathématiques (Lycée Fresnel, Bernay (27))
ÉLÉMENTS DÉTAILLES DU CV
A-EXPÉRIENCE PROFESSIONNELLE
Avril 2013 à ce jour :
Ingénieur d’études statistiques CNRS à DRM et IRISSO à L'Université Paris Dauphine (Paris 16ème)
Septembre 2007 à Mars 2013 :
Ingénieur d’études statistiques CNRS au CERMES3 site de Villejuif : (94)
- Conçoit, met en place, anime, gère et suit les formations aux statistiques (théorie + pratique sur logiciels) pour les chercheurs et doctorants de deux laboratoires CNRS, à DRM et IRISSO: (depuis le 02/04/2013)
- Participe à des projets d’études et de recherches d’analyses et modélisations statistiques
appliqués à la Sociologie et à la Santé Publique (CERMES3 avant Avril 2013) ,
appliqués à la Sociologie, Politique, Économie (IRISSO) et
appliqués à l’Organisation, Finance, Marketing (DRM) (entre le 02/04/2013 et à ce jour) :
-Intègre les connaissances issues des lectures en SHS pour développer les interprétations issues des méthodes et des résultats statistiques proposés et utilisés.
- Recherche, suit et intègre les nouvelles méthodes statistiques actuelles,
en Analyse de Réseaux , Analyse Séquentielle et Textuelle
en Data Mining , Apprentissage statistique , Deep Learning , Machine Learning, Réseaux de Neurones , SVM, Bagging, Boosting, Gradient Boosting, Arbre de Décision , Forêt Aléatoires, Max Entropie... pour et par le ''Big Data et l'Intelligence Artificielle'
en modèles explicatifs et prédictifs explicites ou latents non linéaires et en classifications diverses générales avancées .
Traite et valorise ces méthodes si besoin dans les formations dispensées et/ou les projets articulant méthodes statistiques et thématiques SHS (DRM et IRISSO depuis le 02/04/2013).
- Exploite les différentes sources d’informations des domaines du
Handicap, Santé Publique (CERMES3),
de la Sociologie, Politique, Économie (IRISSO), Organisation, Finances, Marketing (DRM), .
- Définis les méthodes, les outils et les processus informatiques de traitements statistiques et analyse les données qualitatives et quantitatives sur les logiciels statistiques suivants : SAS, SPAD, SPSS, R, STATA, Latent Gold et à terme M+ et UCINET.
- Adapte et optimise les outils de traitements statistiques, en développe au besoin de nouveaux
- Met en forme, saisi les données sous EXCEL, WORD, POWER POINT dont les sorties graphiques,
- Analyse, interprète, synthétise et présente les résultats d’un traitement statistique de façon explicite et pédagogique pour la valorisation des résultats (dont participations aux rapports, annexes scientifiques , articles et publications)
- Participe aux diverses réunions transverses d’équipe, AG, conseils de laboratoire, séminaires de laboratoire, séminaires des projets et formations Dauphine, séminaires statistiques appliqués aux SHS (SFDS, INED, IHP, CMH, ENS, EHESS,…).
2000-2007 : Cadre expert technique analyse qualité Réseaux (France Télécom puis Orange)
- Utilise et suit les évolutions des applications informatiques de gestion des demandes de travaux programmés en transmissions sur une partie des réseaux de France Télécom, Orange.
- Gère le traitement, la préparation et la validation des demandes de travaux programmés en interne à l’Unité et à la demande de clients externes dans le respect des processus.
- Mesure la qualité du réseau de transmission via le système d’information qualité et participe aux actions et
processus de rétablissement et d’amélioration de la qualité des conduits.
- Conçoit et réalise des études d’estimation des risques à priori de dérangements des équipements, à partir de données observées et de modèles statistiques et mathématiques.
- Met en place, suit, commente et analyse des indicateurs qualité Réseau et Client.
- Participe aux réunions d’analyse d’incident.
- Répond aux demandes ponctuelles d’analyse de qualité des conduits de transmission
- Suit la gestion des demandes d’interventions préventives et pré curatives des conduits de transmissions d'une partie du réseau.
1999-2000 : Cadre technique soutien Publiphonie (France Télécom)
- Participe à l’amélioration de la qualité du SI Publiphonie
- Contribue à l’expérimentation, au déploiement et à l’intégration de matériels et d’applications innovantes : bornes Internet publiques, publiphones de troisième génération.
1992-1997 : formateur technique au Service National d’Enseignement (France Télécom) recrutement sur concours de cadre technique à France Télécom (rang numéro 8 national)
- Conçoit et dispense des modules de formations (dont TP) pour des techniciens et cadres de France Télécom en transmissions, codages , numérisations et traitements de l’information, réseaux, téléinformatique, mathématiques appliquées au traitement du signal, au trafic, aux probabilités et statistiques.
- Participe à des plans d’actions de mise en place et de suivis de formations ainsi qu’aux évaluations à chaud et à
froid des formations.
- Conçoit et réalise des sujets d’épreuves de concours internes et externes niveau BAC + 3.
- Fait partie des membres d’un jury de présélection de cadres France Télécom en formation diplômante et qualifiante d’accès au 1er grade de cadre supérieur technique : Coresponsable du module « mathématiques appliquées et traitement et théorie du signal » en formation diplômante et qualifiante en collaboration avec un ingénieur de l’ ENST PARIS.
1989-1990 : Professeur certifié titulaire en Mathématiques (Lycée Fresnel, Bernay (27))
- Conçoit et dispense des cours de mathématiques en classes de lycée général (2nd, 1er,
Terminale)
- Conçoit les sujets des devoirs et corrige , analyse et commente les copies,
-Gère le comportement des élèves et la discipline pour assurer le
bon déroulement des cours en présentiel,
-Participe aux diverses réunions pédagogiques, de suivi et d’évaluation des élèves, de réunions avec les parents et la hiérarchie.
B) DIPLÔMES ET TITRES
2018 : Diplômé du Certificat "Big Data Data Scientist" de l'Université Paris Dauphine
Méthodes statistiques en apprentissages supervisés et non supervisés, Machine Learning, Deep Learning , Réseaux de Neurones
Méthodes informatiques de collectes et de traitements de données massives Big Data en Hadoop, Spark, Hive SQL
Méthodes d'analyses
statistiques et informatiques sur les graphes et les réseaux finis
1998-1999 : Diplômé de l’école d’ingénieur Télécoms Paris Sud : ex I.N.T : (Evry)
Option Signal et Communications numériques en 3ème et dernière année (Bac+5) :
Entré et sélectionné en formation interne qualifiante et diplômante en 2ème année INT
1998 : Enseignement de 2ème année : Modules tronc commun : (moyenne générale : 13,77 / 20)
Analyse numérique (sur MATLAB)
Introduction aux statistiques (théorie des estimateurs généraux , tests statistiques, convergences, compromis Biais Variance)
Recherche opérationnelle et Analyse de données
(théorie des graphes, modélisation du flot maximal, du plus court chemin, tests d’hypothèses générales )
Introduction au SGBD (langage et requêtes SQL)
Initiation au langage de programmation informatique C et C++
Structure des données
Téléinformatique I (couches 1, 2, 3 du modèle OSI, protocole IP)
Téléinformatique II (couches 4, 5, 6, 7 du modèle OSI, protocole TCP)
Files d’attentes, modélisations mathématiques et statistiques du trafic, dont le modèle d’ Erlang et le processus de Poisson
Communications numériques, numérisation des signaux (parole, bruits, images, sons...)
Traitement numérique du signal (cours et TP)
Théorie du signal, Analyse de Fourier et de Laplace, signaux déterministes et aléatoires
Électromagnétisme, propagation, transmissions et communications sur supports filaires , optiques et antennes (cours et TP)
Droit, Économie, Droit de l’information et des télécommunications, Économie industrielle
Gestion des ressources humaines
Gestion financière et marketing
Humanité
Projet de recherche : Estimations paramétriques d’une loi probabiliste mélange de
deux lois Normales Gaussiennes
Méthodes statistiques en théorie des estimateurs programmés en langage C
Langues LV1 : Anglais
Module principal optionnel : signal et image :
Techniques de bases du codage
Introduction à la reconnaissance des formes en apprentissage statistique supervisé
Processus aléatoires discrets, continus et stochastiques, mouvement brownien, marches aléatoires
Statistiques appliquées au signal et à l’image
Introduction aux méthodes avancées de filtrage, dont le filtre de Kalman.
Module secondaire optionnel : Techniques numériques hauts débits, ATM, Réseaux de transmission multi services multi médias
1999 : Enseignements de 3ème année de spécialité: Option Signal, Communications Numériques (moyenne générale 14,73 / 20)
Filtrage optimal et estimation spectrale
Communications numériques
Filtrage adaptatif optimal
Traitement de la parole
Traitement de réseaux d’antennes
Analyse temps fréquence/Analyse multi résolution, théorie et traitement des ondelettes
Projet
Langues LV1 : anglais
Formation humaine
Stage de recherche au C.E.M.I.F : Université d’Evry/Département Statistiques et Modélisations:
Techniques statistiques et algorithmiques en Réseaux de Neurones non linéaires en apprentissage supervisé et non supervisé pour le problème de la séparation des signaux sources statistiquement indépendants.
Estimations comparées de la matrice des mélanges linéaires des signaux sources indépendants à partir d'observations connues
(Programmes d’analyse numérique et algorithmes testés et comparés sur MATLAB)
1988-89 : C.A.P.E.S de Mathématiques (Enseignement général)
1988 : Algèbre, Analyse, Probabilités et Géométrie : niveau BAC + 3 (Épreuves théoriques)
1989 : Mise en situation : Stage pratique en classe de Seconde et Terminale C
1987 : L3 : Licence de Mécanique à l’Université Paul Sabatier (Toulouse)
U1 : Mathématiques appliquées :
Fonctions holomorphes, calculs des résidus, équations et systèmes différentiels linéaires et non linéaires X’(t) = f(X, t), distributions, Équations aux Dérivées Partielles (EDP) , séries et transformées
de Fourier, transformées de Laplace, de Laurent en z, applications diverses.
U2 : Mécanique des fluides, des milieux continus déformables :
Modélisations différentielles et intégrales du mouvement et des contraintes, équations d’Euler, de Navier Stokes, de Bernoulli, de diffusion et réaction, éléments finis, élasticité, viscosité, tenseur des déformations et des contraintes et applications diverses.
U6 : Thermodynamique : cycles, machines thermiques :
Cycles, machines thermiques, les 3 premiers principes de la Thermodynamique, équation de la chaleur, mécanique cinétique et statistique des gaz, transferts, transport optimal et diffusions thermiques.
U5 : Mécanique analytique et vibrations :
Calcul des variations, des chemins optimisant un critère cinétique ou géométrique global, équations de Lagrange, optimisation sous contraintes, principe Hamiltonien, décomposition spectrale, vibrations et perturbations linéaires et non linéaires, calcul harmonique.
1985 : L2 : DEUG A1 à l’université Paul Sabatier (Toulouse)
Analyse, Algèbre, Géométrie, Probabilités
Initiation à l’algorithmique informatique et à la programmation (langage Pascal)
Mécanique classique, relativiste et quantique
Optique, Propagation, Électromagnétisme, Électrocinétique, Thermodynamique, Chimie (cours et TP)
Admissible au concours de l’École Nationale d’Aviation Civile à Toulouse en fin de L2.
1982 : BAC C au Lycée David d’Angers (Angers) : Filière scientifique à dominantes mathématiques et physique-mécanique-chimie
C) STAGES, PROJETS D’ÉTUDES ET RECHERCHE FINALISES
1998 (Télécoms Paris sud : ex I.N.T à Evry) Projet de recherche : (note 18/20)
Estimations paramétriques d’une loi probabiliste mélange de deux lois Gaussiennes non indépendantes :
Coefficients du mélange et paramètres statistiques de chaque loi à estimer :
Méthodes statistiques (EM, SEM, gradient stochastique) en théorie des estimateurs.
Outil informatique : langage C
1999 (C.E.M.I.F : Université d’Evry) Stage de recherche (note 16/20)
Études et recherches en traitements algorithmiques et statistiques pour le problème de la séparation de signaux sources statistiquement indépendants, déduits de mélanges linéaires donnés connus observés :
Recherches statistiques en ACI, en Réseaux de Neurones et ACP générales non linéaires:
(Matrice du mélange linéaire inconnue et à estimer)
Analyse en composantes principales et indépendantes, tests comparatifs d’algorithmes utilisés
Recherche d’algorithmes nouveaux et plus performants : calculs de qualité de séparation des signaux.
Application biomédicale sur les capteurs et signaux cardiaques mélanges du fœtus et de la mère. Outil informatique : MATLAB.
2001 (France Télécoms Paris 14e)
Responsable de la modélisation et de l’estimation de la loi probabiliste des durées de vie d’équipements de transmissions de télécommunication, pour une étude d’aide à la décision sur le dimensionnement des stocks de maintenance des cartes de transmission Télécoms, pour un centre Télécom et une période donnée.
Supports de bases d’entrées : données d’observations de baisse de qualité et dérangement des conduits de
transmission.
Outil informatique : EXCEL (développement de macros), WORD, POWER POINT
Sept 2007-Mars 2013 (CNRS unité de recherche CERMES3 : Villejuif 94)
Projet d’étude statistique « usagers des fauteuils roulants » participation à une publication
Données qualitatives et quantitatives relatives aux enquêtes « Handicap Incapacité Dépendance »
Personnes en domicile (1999) et en institution (1998).
Étude de la typologie des usagers des fauteuils roulants manuels : analyses des profils d’usagers, ACP, ACM, Classifications, Modèles
Problématiques du processus et plan d’échantillonnage, de la pondération, du choix des variables
des modalités, des individus et du nombre de classes retenues pour les analyses et traitements.
Études et analyses comparées de la prévalence : analyse des facteurs explicatifs et conséquents entre 1999 et 2009.
Projet d’étude statistique « Alzheimer et troubles UNAFAM » participation à une publication
Données qualitatives et quantitatives relatives aux enquêtes « Handicap Incapacité Dépendance »
Personnes en domicile (1999) et en institution (1998).
Estimation et construction de la population Alzheimer déclarée et probable en domicile et institution :
Problématiques de l’identification de la population cible Alzheimer, du choix des variables et des modalités, de l’affectation en Alzheimer probable, classifications par famille de causes et déficiences, étude de profils et de fonctions scores , prévalence, pondération, standardisation, outils statistiques divers d’aide au diagnostic 'Alzheimer' dont modèles de Régressions et Analyses Discriminantes
Comparaisons et caractérisations des populations Alzheimer « probables vs sûrs », problématiques des accès de prise en charges : Analyses descriptives et explicatives multifactorielles sur les causes et conséquences des troubles.
Synthèse, interprétations et valorisations des données et résultats pertinents dans le domaine d'étude.
Projet d’étude statistique « IVG » participation à une publication
Construction d’une base de données (saisie de questionnaires) IVG : analyse des profils, des comportements des partenaires masculins IVG par l’analyse de tris croisés et tests d’hypothèses simples et multiples : Commentaires et interprétations.
Avril 2013-à ce jour (CNRS unité de recherche DRM et IRISSO Paris Dauphine 16eme)
Projets d’études et recherches statistiques finalisés et validés à ce jour à DRM et IRISSO
*Modélisation optimale du score de bi satisfaction mixte expliquant la fidélité marketing (sur
SPSS) :
*Processus opérationnel optimal sur les Analyses Factorielles classiques et confirmatoires en équations structurelles, typologies associées sur la notion du « bien vieillir désiré latent et manifeste » (sur SPSS)
*Modèles explicatifs sur des variables de réseaux, régressions QAP en réseaux avec les liens et
variables relationnelles dépendantes sur l'immobilier commercial en France, déterminants de la ressemblance (sur R)
*Informations, conseils théoriques et pratiques sur les régressions logistiques généralisées, contexte de validité et d'utilisation des régressions logistiques sur des données « Éducation » (sur SPSS)
*Tests de Dunnet sur des données et hypothèses éthiques et perceptions des messages en entreprises (sur
SAS)
* Modèles généraux de régressions logistiques avec interactions non linéaires croisées sur la satisfaction des biens immobiliers expliquée notamment par l'émotion (sur SPSS)
*Conceptions et utilisations de modèles de régressions logistiques de panels appliqués aux variables et indicateurs "gouvernance, risque, faillites, finances des banques européennes , asiatiques et américaines" (sur STATA, EXCEL)
*Projet ACM , classifications, modèles de régressions, modèles à variables instrumentales, comparaison des méthodes factorielles ACM vs ASCAL sur le travail, perceptions et profils des éboueurs de Paris (sur SPAD ,SAS)
*Construction , analyses et traitements statistiques ACM, régressions logit, mise en place d'une étude sur les effets partiels et marginaux appliquée sur des bases de données SAS "projet culture et films " (sur SAS et EXCEL)
* Méthodes statistiques diverses sur des bases de données internationales sur le vieillissement croisé avec l'économie, géographie, mobilité, démographie, environnement, santé : Projet international ANR Odessa avec la France, GB , Chine Construction des bases de données en cours à ce jour (sous STATA)
*Modélisations et constructions de sous échantillons représentatifs optimaux sur des données des juristes et études des notaires en France + modèles GLM et Multi niveaux sur rentabilité des offices (sur EXCEL et SAS)
* Modèles D'équations Structurelles SEM sur les données et indicateurs de modélisation de la confiance inter entreprises et inter culturelles sur des données Décathlon (sur SAS et EXCEL)
* Constructions de bases de données et traitements en analyses factorielles et classification CAH et modèles explicatifs sur des données et questionnaires de trajectoires d’expérience de CV de dirigeants d’audit financiers (sur SPAD, R, EXCEL)
*ACM et Classifications sur des données sur les primes variables et leurs perception chez les cadres (sur SPAD)
*Estimations et interprétations en ACM , construction et lecture des axes factoriels sur des données de travail des inspecteurs du Ministère de la Culture (sur EXCEL et R)
*Construction et analyse d'une base de données sur intentions des votes politiques pour les extrêmes PC et FN :
statistiques de bases, hypothèses, ACM, Classifications
*Constructions de fichiers et d'indicateurs, ACM, ACP, AFC, Classifications, tests et régressions sur des données "Séries TV , films culture, profils" (sur EXCEL, R, SAS, SPAD)
*Modèles GLMM mixtes multi niveaux panels de Poisson à effets et facteurs latents aléatoires sur des données économétriques et financières ( sur Latent Gold)
*Modèles d’Équations Structurelles SEM linéaires et non linéaires avec interactions produits , AFC sur des données sur les soins qualité de services des hôpitaux en Thaïlande (sur SAS)
*Projet sur les modèles 'équations structurelles SEM à variables latentes et manifestes' sur des données "perception et conditions au travail " et "modélisation de la reconnaissance au travail, satisfaction et engagement au travail "
*Modèles d’Équations Structurelles SEM à facteurs latents et items manifestes sur des données de mesures d'indicateurs "expérience client, satisfaction, fidélité marketing" , AFC confirmatoire et oblique (sur SAS, EXCEL )
*Méthodes ACM , modèles généraux sur des données « séries TV , culture et films » (sur SAS et SPAD)
*ACM, ACP, AFC, estimations de statistiques croisés sur des données "Distinctions" sur les pratiques culturelles (sur SPAD, SAS)
*Projet SHS quanti sur une étude et recherche 'gaspillage des objets' en méthodes ACP ACM CAH sur SPSS et/ou sur SPAD
*Construction de la BD et constructions, estimations, interprétations d'ACM et de CAH ,
construction, analyse et lecture des axes factoriels et classifications sur des données sur les Élites au Mexique
Projets d’études et recherches en cours d’étude et traitements à ce jour, à DRM et IRISSO
* Modèles de panels linéaires et modèles GLM pour l’étude de données économétriques, financières, chiffres d’affaires, tests d’hypothèses associées (sur STATA, SAS)
*Analyses ACM, classifications, statistiques descriptives multivariées, analyse de réseaux et séquentielles et modèles GLM panels sur "évocations multiples " 'Bien être, Qualité de Vie au Travail' des cadres de BNP Paris Bas (sur SPAD, SAS, R)
* Analyses des graphes, réseaux des firmes « financières vs non financières » : centralités, densités, indicateurs descriptifs et probabilistes en réseaux, liens, tests d’hypothèses (sur EXCEL, GEPHI)
ACM, Classifications sur des données sur les "Élites au sens large" :
Questions et solutions sur l'effet "taille d'effectif" sur les contributions des variables en ACM (sur SPAD et EXCEL)
*Projet IRIS PSL (**) initialisé en 2016 : participant potentiel éventuel en tant que statisticien : "Governance and Analytics"
*Projet sur les équations structurelles SEM à variables latentes sur des données "perception et conditions au travail " et "modélisation de la reconnaissance au travail" + Régressions générales (ex Modèles Binomiale Négative et Poisson) sur M+
*Construction de fichiers et merge pour des modèles explicatifs à décalage temporels 'g.logit' sur les salariés actifs en 2013 et 2016: modélisation et estimation des taux d'évolutions entre 2013 et 2016
*Projets et méthodes statistiques générales ACP, ACM, Modèles de régressions, tests sur des données contrat de travail,
salariat, consultants, travailleurs indépendants (sur EXCEL SAS R)
*Projet en modèles de panels à décalage temporel sur modèles de prévision de provisionnement des pertes sur prêts des banques de développement
|
*Projet sur l'influence endogène des grèves et réputations dans les entreprises, sur leur attractivité et motivation des salariés , régressions linéaires, modèles panels, modèles dynamiques
*Obtention et traitements statistiques variés (constructions de fichiers et de variables , tris, filtres, ACM, AFC, CAH ,tests…) sur nouvelle enquête 2018 et bases "Profils, Films, Vidéos, Séries TV " (EXCEL , R , et SPAD.9.3)
*Obtentions et traitements statistiques variés sur données textuelles en analyse sémantique en data mining sur R "TextMining EuroPress" et projet en régressions logistiques sur R .
*projet en modèles de panels à décalage temporel sur modèles de prévision de provisionnement des pertes sur prêts des banques de développement (STATA, SAS)
*projet en constructions et méthodes statistiques générales ACP, CAH, Modèles de régressions, tests, moyennes temporelles des Chiffres d'affaires et mois d'activités sur des données contrat de travail, salariat, consultants, indépendants, données clients et profils temporels dynamiques , méthodes modèles statistiques et mathématiques associés version 1 ( R, SAS, SPAD)
*Projet ACM ,classifications, tests, méthodes descriptives et modèles explicatifs sur les formes et les objets managériaux de l'engagement professionnel à 3 modalités en entreprises privées, publiques
Participations statistiques et nommé en co-auteur dans 8 publications à ce jour
Prévus à court et moyen terme (2021-2023), à initialiser (logiciels à définir) hors projets en cours
* Modèles explicatifs en données de panels + méthodes avancées de modélisation sur des données « Sciences de l’Éducation et
Enseignement «
*Méthodes statistiques diverses, modèles généraux sur des données "Éducation"
projet 'Sciences de l’Éducation, modes et inégalités scolaires, école pour et par le Numérique ' sur base de données existantes en cours
* en version 2 à améliorer et à compléter suite du projet en constructions et méthodes statistiques générales ACP, CAH, Modèles de régressions, tests, moyennes temporelles des Chiffres d'affaires et mois d'activités sur des données contrat de travail, salariat, consultants, indépendants, données clients et profils temporels dynamiques , méthodes modèles statistiques et mathématiques associés ( R, SAS, SPAD)
*traitements statistiques , recodages, tris croisés, tests, régressions sur des données sur les développeurs web informatique et informaticiens (sur R , SAS, EXCEL, SPAD)
4 participations potentielles à des publications de prévues à moyen terme.
D-Méthodes statistiques connues et/ou utilisées
Niveau 1 : (BAC à BAC +1)
*Constructions de fichiers, des pondérations, des variables, des modalités et des individus, standardisations, tris et
filtres simples et multiples, probabilités et statistiques de bases en dimension 1 et 2 sur variables nominales et numériques.
*Estimateurs et estimations non biaisés, à variance minimale, compromis 'biais - variance' sur échantillons simples et structurés Estimateurs uni ou bidimensionnels classiques sur variables qualitatives (Khi2, Concordance, Kappa…) ou quantitative ( moyenne, variance, écart type, quartiles, médiane, densité, fonction de répartition, corrélations, covariances, coefficient d’asymétrie et d’aplatissement) , Estimations et hypothèses sur les densités et fonctions de répartitions des lois de distributions de probabilités :
Binomiale, Poisson, Hypergéométrique, Normale, Log-Normale, Exponentielle, Khi2, Gamma, Beta, Cauchy, Weilbull …….) ,
Statistiques 'théoriques et pratiques' et calculs d’estimateurs , d’indicateurs généraux , calcul de prévalence ,
de cohérence et de validation.
*Tests d’hypothèses paramétriques, semi paramétriques, non paramétriques, puissances des tests, tests optimaux à puissance maximale, intervalles et zones de confiances, p_value , risques et puissance d’un test statistique, tests sur les paramètres de variables, sur les lois probabiliste des variables aléatoires , sur des distributions observées de variables.
Niveau 2 : (BAC +1, + 2)
*Analyses Descriptives et Exploratoires,
Analyses Factorielles Multidimensionnelles de base : ACM, AFC, ACP
Classifications usuelles hiérarchiques, mixtes, dynamiques, optimisation d’échelles de distances et de métriques quadratiques
Niveau 3 : (BAC +2, +3)
*Modèles explicatifs et prédictifs à effets fixes et variables manifestes :
Régressions Multilinéaires, Régressions logistiques logit, g.logit, probit, Modèles log-linéaires, Modèles GLM, Analyse de la Variance ANOVA, Analyses Discriminantes Linéaires AFD.
Niveau 4 : (BAC +3, + 4, +5)
* Compléments, avancées en Analyses factorielles et Classifications :
AFDM, AFM, ACI
Méthode ALSCAL de positionnement multidimensionnel optimal
Classifications LPA, FMA sur classes latentes, Classification par méthodes de Bayes conditionnelles
Apprentissage non paramétrique dont les réseaux de neurones pour la classification et la prédiction par groupes , courbes et surfaces discriminantes de décisions et de séparation , Analyse Discriminante non linéaire,
Méthodes d'ajustement sur score de propension Matching, effets et variances d'un traitement binaire sur un résultat à expliquer, équilibrage statistiques des
variables explicatives avant et après méthode d'appariement.
*Processus aléatoires stochastiques, Chaines de Markov, Marches Aléatoires en dimension finie , à temps discret et continu, mouvement brownien, équations différentielles stochastiques appliquées à la finance, économétrie, modèles des files d’attentes, modèles d’ Erlang et de Poisson, modèles dynamiques des séries temporelles ARIMA(d,p,q) autos et inter corrélés à décalages récurrents finis .
*Données et modèles de de panels, données avec autos corrélations individuelles et temporelles en lignes et colonnes, données et variables à double indice (individus, temps) , estimateurs , estimations et tests associés (modèles linéaires et non linéaires).
*Estimation Bayésienne , modèles avancés et généraux linéaires ou pas
Modèles linéaires mixtes et généralisés, à effets fixes et aléatoires , modèles a variables instrumentales, endogènes et exogènes ,
Modèles multi niveaux , modèles des durée de vie, à hasards instantanés proportionnels ou quelconques,
Modèles SEM à équations structurelles à variables latentes et manifestes , régressions PLS, analyses factorielles confirmatoires obliques
Modèles SEM non linéaires par changement de variables, items ordinaux et facteurs latents modérateurs à interactions croisées produit
Modèles semi paramétriques , modèles à données censurées de survie , modèle Tobit, modèles de Poisson , de Cox,
Modèles et Régressions pseudos linéaires par changement d'échelles, Régressions sur Variables Instrumentales, Régressions Ridge, Lasso, contraintes et pénalités sur les effets et les variables , modèles latents , Régressions Splines,
Régressions Polynomiales à effets croisés doubles d'interactions, à variables médiatrices et modératrices,
Régressions à intercept Aléatoire , régression Binomiale Négative, Gamma.
Modèles à équations linéaires multiples MANOVA , Analyses Canoniques
Équations stochastiques pour la finance, étude des modèles prédictifs non linéaires généraux
*Modèles actuels de régression QAP sur données réseaux non indépendantes, centralités et densités en Analyse des réseaux de liens finis.
*Estimateurs généraux MV, MGG, MCC, MVR, estimateurs MCG généralisés sur erreurs corrélées et hétérogènes, estimateurs VI des variables instrumentales, estimateurs MC2NL des doubles moindres carrés non linéaires, méthodes algorithmiques itératives générales d’estimations (Newton, Gauss, Gradient, Gradient stochastique, EM, Monté Carlo, boostrap, Hermitte Gauss…..)
*Big Data et Réseaux de neurones, apprentissages paramétriques et non paramétriques supervisés et non supervisés sur données massives complexes et hétérogènes, méthodes statistiques générales et diverses en Machine Learning "Big Data et Intelligence Artificielle",
méthodes Logit, Bayes Naif, Arbre de Décision, Forêt Aléatoire, SVM linéaires et non linéaires, Réseaux de Neurones, SLDA, Bagging, Boosting, Gradient
Boosting, Max entropie.
Formations de sensibilisation pédagogique à la Culture technique et éthique 'Digital Numérique Big Data I.A Algorithmes'
Outils informatiques et statistiques :
EXCEL, WORD, POWER, POINT INTERNET (bureautique) et
SAS9.4, SPADv9.1, STATA, SPSSv18, R3.4.4, M+7, GEPHI082, (logiciels statistiques)
MATLAB (logiciel d’analyse et calcul numérique)
Autres activités et loisirs
*Cours particuliers en mathématiques et statistiques de la seconde générale à BAC + 2 : 14 ans d’expérience pédagogique en cours individuels et individualisés à la carte.
*Vacations supplémentaires en Statistiques Appliquées:
-sur SAS en Master 1 Sociologie à L’Université Paris X Nanterre
(24h en CM de Janvier 2016 à Avril 2016 : )
-sur R pour les CR et les MCF de l'Université Paris Dauphine et plus généralement de l'Université PSL ( 22 h à ce jour)
Sports pratiqués
Tennis et Tennis de Table en compétitions par équipe et en individuel, foot et vélo en loisirs
Musiques pratiquées
Musiques de films, jazz, bossa nova, improvisations et compositions personnelles sur piano et synthétiseur
électronique
Autres
Cinéma, lectures, concerts…