Types de métiers Crédit Agricole S.A. - Marketing et Communication
Stage
6
Non
Non cadre
Descriptif de la mission :
Dans le secteur banques et assurances, les bases documentaires sont nombreuses et couvrent plusieurs thématiques: réglementaire, client, marketing et communication, etc. Les experts et conseillers en banque ont souvent recours à ces bases de données dans leurs tâches quotidiennes (exemple: apporter une réponse précise à une question posée par un client). La recherche d’information rapide et pertinente est donc un besoin important pour accélérer l’accès à la bonne information.
Dans ce stage, nous nous intéressons à ces nouvelles approches de recherche d’information par réseaux de neurones profonds pour enrichir les fonctionnalités de la version actuelle du moteur de recherche. Nous nous intéresserons en particulier aux techniques de recherche automatique d’extraits optimisés (features snippets) pour restituer les passages les plus pertinents des documents retournés par le moteur de recherche. Pour ce faire, on se reposera sur les approches de représentation vectorielle des requêtes et des documents et mesures de similarité utilisés principalement dans les systèmes de Question/Réponse. Des approches de transferts d’apprentissage à partir de gros corpus externes et internes sont aussi à explorer pour affiner ces représentations vectorielles. On se propose d’évaluer les performances des modèles de langage récents de type BERT, XLNET, etc. sur des corpus en langue française.
Toutes ces approches seront développées et évaluées sur des corpus internes au groupe Crédit Agricole et externes (comme le corpus publié dans la compétition Kaggle
TensorFlow 2.0 Question Answering).
Organisation et livrables :
Pour ce faire, le stage se déroulera en quatre étapes principales, sous l’encadrement de Data Scientists:
Réalisation d’un état de l’art sur la recherche d’information et les systèmes de Question/Réponse par réseaux de neurones profonds ; Sélection et implémentation des algorithmes les plus adaptés à la problématique et aux corpus; Réalisation d’une étude comparative pour évaluer les approches implémentées.Des interactions avec des services métier du groupe seront organisées.
Europe, France, Ile-de-France, 92 - Hauts-De-Seine
Bac + 5 / M2 et plus
Université, Ecole d'ingénieur : Formation comportant une dominante NLP (traitement de langage naturel), Data Science, Machine Learning, Deep Learning, Intelligence artificielle, incluant de solides connaissances en développement logiciel.
0 - 2 ans
Anglais : opérationnel (usage régulier)
Le secteur de la cybersécurité souffre d'une pénurie de talents face aux menaces actuelles. La formation dans le domaine reste la réponse...
User Experience Designer, expert en Millennial, YouTuber ou encore chauffeur de VTC ; les dix ans de technologie que nous venons de vivre...
Nous vivons dans un monde hyper connecté, où de plus en plus d'entreprises fournissent des ordinateurs portables et des smartphones dans...
Si les algorithmes régissent notre vie virtuelle, ils peuvent également être de véritables atouts pour gagner en performance et en...
Inscrivez-vous pour accéder à l'annonce
Stage Assistant Data Scientist – Moteur de recherche sémantique H/FEn cliquant ci-dessus sur « S'inscrire » vous accepter nos conditions générales et notre politique de confidentialité
1er Site de recherche d'emplois dédié aux professionnels du marketing de la communication et du digital, Jobibou.com a pour objectif de vous offrir le meilleur outil de recherche pour vous accompagner, au mieux, dans votre démarche de recherche d'emploi
Inscrivez-vous pour accéder à l'annonce
Stage Assistant Data Scientist – Moteur de recherche sémantique H/FMerci de bien vouloir remplir le formulaire pour profiter de l’ensemble des fonctionnalités Jobibou !
Déjà inscrit ? Se connecter