Consultez nos dernières offres similaires
Contenu de l'offre Alternance : Alternant(e) - Ingénieur Big Data (H/F) chez Webedia
Qui sont-ils ?
Webedia est une société media-tech et l’un des acteurs mondiaux majeurs du divertissement en ligne.
S’appuyant sur 15 ans d’expertise des audiences digitales et de l’édition de médias numériques (29 millions de visiteurs uniques en France et 250 millions dans le monde* , avec des marques comme AlloCiné, JV, Purepeople, 750g ou encore easyVoyage et Dr. Good !) nous accompagnons les plus importants créateurs, producteurs, diffuseurs et les marques avec un savoir-faire unique de production et de distribution de contenus sur toutes les plateformes.
Parmi nos top créateurs en France figurent Michou, Inoxtag, Domingo, Lorylyn, Fatou Guinea, Jamy Gourmaud ou encore Michel Cymes.
Présent dans plus de 15 pays, Webedia structure ses activités autour de métiers complémentaires : la distribution de contenus, l’édition de marques et supports médias, la gestion de créateurs et la production audiovisuelle.
Médiamétrie/NetRatings, Internet Global, mars 2022 / * Comscore mesure internationale multi-écrans, décembre 2020
Descriptif du poste
Intégré(e) dans l’équipe data de webedia (5 data engineer/scientist en CDI et 2 à 3 stagiaires/alternants), vous travaillerez à la construction d’outils de pilotage appliqués à nos dispositifs contenus.
Vous aurez pour mission de développer des outils de pilotage dans un environnement big data (on process 250 TB de données par mois).
Concrètement, cela veut dire :
· Développer des scripts d’ingestions et de préparations de données dans une architecture Big Data ;
· S’assurer de la fiabilité des données remontées ;
· Suite à des discussions avec des experts métiers, créer un plan de collecte de données et concevoir une architecture cible ;
· Mettre à jour des dictionnaires de données à destination des experts métiers et les accompagner dans leur utilisation de ces données.
Exemples de problématiques big data sur lesquels nous travaillons :
· Consolider des données de visites et les revenues générés par page sur nos sites internets ;
· Exploiter les données de performances des vidéos que webedia poste sur facebook, snapchat et youtube.
Notre stack technique :
· Nous utilisons les outils cloud de google ;
· Bigquery en entrepôt de données Big Data (ça se requête en SQL) : https://cloud.google.com/bigquery /
· DBT un framework SQL qui nous aide à fiabiliser et documenter nos pipelines de données : https://www.getdbt.com / ;
· Datastudio notre outil de dashboarding no code : https://datastudio.google.com/overview ;
· Nous avons partagé sur ce blog certaines de nos réalisations : https://webedia.io / .