Senior Research Engineer - Data

Synthesia
,
Synthesia logo

Oversigt og nøgleindsigter

Stillingen som Senior Research Engineer - Data hos Synthesia involverer at arbejde med storskala video- og lyddata for at forbedre modelpræstationer gennem højkvalitets datasæt. Rollen er centreret omkring anvendt forskning, data engineering og ML infrastruktur.

Højdepunkter

  • Arbejde med over en million timers video- og lyddata.
  • Bygning af verdens bedste human-centric data lake.
  • Samarbejde med modeltræningsteams for at udtrække nye funktioner og annotationer.

Påkrævede kvalifikationer

  • Baggrund i Computer Science, Computer Vision eller Audio ML.
  • Erfaring med dyb læring og produktionsmiljøer.
  • Stærke Python færdigheder og passion for ren, vedligeholdelsesvenlig kode.

Ønskværdige kvalifikationer

  • Erfaring med behandling af store datamængder i video- og/eller lyddomænet.
  • Erfaring med dataaspekter af et GenAI produkt.

Den ideale kandidat

Den ideale kandidat er en passioneret ingeniør med stærk baggrund i computer science og erfaring i dyb læring. Personen skal være i stand til at arbejde med store, komplekse datasæt og drive innovation gennem præcise og effektive datastrukturer.

Jobdetaljer

Løn efter aftale
Fuldtid
timer/uge
Fuldtid remote

Jobbeskrivelse

Welcome to the video first world

From your everyday PowerPoint presentations to Hollywood movies, AI will transform the way we create and consume content. Today, people want to watch and listen, not read — both at home and at work. If you’re reading this and nodding, check out our brand video.

Despite the clear preference for video, communication and knowledge sharing in the business environment are still dominated by text, largely because high-quality video production remains complex and challenging to scale—until now….

Meet Synthesia

We're on a mission to make video easy for everyone. Born in an AI lab, our AI video communications platform simplifies the entire video production process, making it easy for everyone, regardless of skill level, to create, collaborate, and share high-quality videos. Whether it's for delivering essential training to employees and customers or marketing products and services, Synthesia enables large organizations to communicate and share knowledge through video quickly and efficiently. We’re trusted by leading brands such as Heineken, Zoom, Xerox, McDonald’s and more. Read stories from happy customers and what 1,200+ people say on G2.

In February 2024, G2 named us as the fastest growing company in the world. Today, we're at a $2.1bn valuation and we recently raised our Series D. This brings our total funding to over $330M from top-tier investors, including Accel, Nvidia, Kleiner Perkins, Google and top founders and operators including Stripe, Datadog, Miro, Webflow, and Facebook.

What you'll do at Synthesia:

The Data team manages the complete lifecycle of data for researchers - from sourcing and large-scale processing to delivering datasets that power our models. Data sits at the heart of our Research efforts and enables all other teams. As part of the Data team, you’ll work with over a million hours of video and audio data.

This role exists at the intersection of applied research, data engineering, and ML infrastructure rather than being a traditional research position. You’ll build the world’s best human-centric data lake by collaborating closely with our model training teams. By understanding their requirements, you’ll extract new features and annotations that elevate our datasets. You should be passionate about enhancing model performance through high-quality, accurate datasets. Our infrastructure and pipelines are in great shape, and this role provides room to not only enhance them but also influence the team’s longer-term strategy.

What we're looking for:

  • Background in Computer Science, Computer Vision, or Audio ML
  • Experience working in deep learning teams and production environments
  • Strong Python skills and a passion for clean, maintainable code
  • Hands-on experience with workflow orchestration
  • Interest in large-scale, non-tabular data (video, audio, images)

Bonus point if you have experience in:

  • Processing large volumes of data in the video and/or audio domain
  • Working on the data side of a GenAI product

Why join us?

We’re living the golden age of AI. The next decade will yield the next iconic companies, and we dare to say we have what it takes to become one. Here’s why,

Our culture

At Synthesia we’re passionate about building, not talking, planning or politicising. We strive to hire the smartest, kindest and most unrelenting people and let them do their best work without distractions. Our work principles serve as our charter for how we make decisions, give feedback and structure our work to empower everyone to go as fast as possible. You can find out more about these principles here.

Serving 50,000+ customers (and 50% of the Fortune 500)

We’re trusted by leading brands such as Heineken, Zoom, Xerox, McDonald’s and more. Read stories from happy customers and what 1,200+ people say on G2.

Proprietary AI technology

Since 2017, we’ve been pioneering advancements in Generative AI. Our AI technology is built in-house, by a team of world-class AI researchers and engineers. Learn more about our AI Research Lab and the team behind.

AI Safety, Ethics and Security

AI safety, ethics, and security are fundamental to our mission. While the full scope of Artificial Intelligence's impact on our society is still unfolding, our position is clear: People first. Always. Learn more about our commitments to AI Ethics, Safety & Security.

The good stuff...

  • Competitive compensation (salary + stock options + bonus)
  • Hybrid work setting with an office in London, Amsterdam, Zurich, Munich, or remote in Europe.
  • 25 days of annual leave + public holidays
  • Great company culture with the option to join regular planning and socials at our hubs
  • + other benefits depending on your location

Karrierevej

Typisk karriereforløb

1

Lead Research Engineer

2

Head of Data Science

3

Chief Technology Officer

Vækstpotentiale

Stillingen som Senior Research Engineer - Data hos Synthesia giver betydelige vækstmuligheder, da virksomheden er på forkant med AI-drevet videoindhold og kontinuerligt ekspanderer. Med virksomhedens hurtige vækst og høje værdiansættelse kan medarbejdere forvente at deltage i innovative projekter og avancerede forskningsinitiativer.

Overførbare færdigheder

Data EngineeringMachine LearningDeep Learning

Branchekontekst

Stillingen er central i den hurtigt voksende AI-industri, især inden for digital kommunikation og indholdsproduktion. Med fokus på at levere avancerede datasæt til AI-modeller, spiller denne rolle en kritisk del i at drive innovation og effektivitet i videoindholdsskabende teknologier.

Færdighedsanalyse

Kritiske færdigheder

Computer Science, Computer Vision, or Audio ML

En stærk baggrund inden for datalogi, computervision eller audio maskinlæring er nødvendig for at kunne bidrage effektivt til teamet.

Deep Learning i produktionsmiljøer

Erfaring med at arbejde i dyb læringsteams og anvende teknologier i produktionsmiljøer er afgørende for at kunne håndtere komplekse dataopgaver.

Python

Stærke Python færdigheder og en passion for ren, vedligeholdelsesvenlig kode er vigtige for at skrive og vedligeholde scripts og data pipelines.

Vigtige færdigheder

Workflow Orchestration

Hands-on erfaring med orkestrering af workflows er vigtig for at kunne automatisere og optimere dataarbejdsgange.

Stor-skala, ikke-tabular data

Interesse for at arbejde med store mængder ikke-tabular data såsom video, lyd og billeder er vigtig for at kunne håndtere og analysere data effektivt.

Ønskværdige færdigheder

Behandling af store datamængder i video/lyd domæne

Erfaring med at behandle store datamængder i video- og lyd-domaener kan give en fordel i arbejdet med komplekse datasæt.

Data i GenAI produkter

Erfaring med at arbejde på datasiden af generative AI produkter kan være en fordel.

Mest kritiske færdigheder

Computer Science, Computer Vision, or Audio MLDeep Learning i produktionsmiljøerPython

Sådan fremhæver du din erfaring

For at fremhæve relevante erfaringer, kan du beskrive tidligere projekter, hvor du anvendte dyb læring og Python til at håndtere store mængder data, og hvordan du orkestrerede workflows for at optimere processerne. Nævn specifikke teknologier og værktøjer, du har arbejdet med, og hvordan det bidrog til projektets succes.

Interviewforberedelse

Sandsynlige spørgsmål

Kan du beskrive din erfaring med at arbejde med dyb læring i produktion?

erfaring

Tip: Fremhæv specifikke projekter, hvor du har implementeret dyb læring, og hvordan det påvirkede resultatet.

Hvordan sikrer du, at dine Python-koder er rene og vedligeholdelsesvenlige?

teknisk

Tip: Diskuter din tilgang til kodestandarder, brug af værktøjer til kodeanalyse, og hvordan du holder dig opdateret med bedste praksis.

Fortæl om en gang, hvor du forbedrede en datainfrastruktur eller pipeline.

situation

Tip: Brug STAR-metoden (Situation, Task, Action, Result) til at beskrive, hvordan du identificerede problemet og implementerede løsningen.

Hvordan håndterer du store mængder data i video- og/eller lydområdet?

teknisk

Tip: Diskuter værktøjer og teknikker du har brugt, f.eks. specifikke biblioteker eller cloud-tjenester, og hvordan du optimerede behandlingen.

Hvad motiverer dig til at arbejde inden for AI og videokommunikation?

kultur

Tip: Vis din passion for AI og videokommunikation ved at forbinde det til dine personlige interesser eller karrieremål.

Spørgsmål du kan stille

  • Hvordan arbejder data- og modeltræningsteams sammen hos Synthesia?
  • Hvilke udfordringer ser I i fremtiden for jeres data pipeline?
  • Hvordan understøtter Synthesia medarbejdernes faglige udvikling?

Tale punkter

  • Min erfaring med at forbedre datainfrastrukturen i tidligere projekter.
  • Hvordan jeg har arbejdet med ikke-tabelformede data, især video og lyd.
  • Min passion for at arbejde på tværs af teams for at forbedre modelpræstationen.

Bekymringspunkter at være opmærksom på

  • Manglende erfaring med håndtering af store, ikke-tabelformede datamængder.
  • Begrænset forståelse for workflow orkestrering.

Ansøgningsstrategi

Ansøgningstips

  • Sørg for at demonstrere din erfaring med data engineering og ML infrastruktur ved at inkludere specifikke projekter, hvor du har arbejdet med store mængder af video- og audiodata.
  • Fremhæv din evne til at arbejde i tværfunktionelle teams, især hvordan du har samarbejdet med modeltræningsteams for at forbedre datasetkvalitet.
  • Vis din passion for at forbedre modelpræstationer gennem nøjagtige og høj-kvalitets datasæt ved at nævne konkrete resultater, du har opnået i tidligere roller.

Nøgleord at inkludere

Deep LearningComputer VisionData EngineeringPythonAI Video Communications

Fokus i ansøgningen

Fremhæv din erfaring med at arbejde med store, ikke-tabelbaserede datasæt og hvordan dette har forbedret modelpræstationer. Beskriv din passion for AI-drevet videokommunikation og hvordan din tekniske ekspertise kan bidrage til at udvikle verdens bedste human-centric data lake hos Synthesia.

Tilpasning af CV

Tilpas dit CV ved at inkludere specifikke eksempler på din erfaring med videodata og ML-infrastruktur. Fremhæv tekniske færdigheder som Python og workflow orchestration, samt konkrete resultater der viser din evne til at forbedre datasæt gennem samarbejde med modeltræningsteams.

Ofte stillede spørgsmål

Hvad indebærer stillingen som Senior Research Engineer - Data hos Synthesia?

Stillingen involverer håndtering af dataens livscyklus for forskere, fra sourcing og storstilet behandling til levering af datasæt, der driver vores modeller. Du vil arbejde med videoer og lyddata og bygge verdens bedste menneskecentrerede data lake.

Hvilke kvalifikationer kræves for at blive Senior Research Engineer - Data?

Du skal have en baggrund i datalogi, computervision eller audio ML samt erfaring med dybe læringsteams og produktionsmiljøer. Stærke Python-færdigheder og erfaring med workflow-orkestrering er også nødvendige.

Hvad tilbyder Synthesia deres ansatte?

Synthesia tilbyder muligheden for at arbejde med førende teknologi inden for AI-videokommunikation og at være en del af en hurtigt voksende virksomhed, der er støttet af top-tier investorer.

Hvordan er arbejdsmiljøet hos Synthesia?

Arbejdsmiljøet hos Synthesia er innovativt og samarbejdende, med fokus på at gøre videoproduktion enkel og tilgængelig for alle. Der er også mulighed for at påvirke langsigtede strategier.

Hvad er forventningerne til en Senior Research Engineer - Data hos Synthesia?

Forventningerne inkluderer at forbedre modelpræstationer gennem høj-kvalitets datasæt, samarbejde med modeltræningsteams og arbejde på anvendt forskning, data engineering og ML infrastruktur.

Er der specifikke erfaringer, der giver en fordel i denne rolle?

Ja, erfaring med behandling af store datamængder inden for video- og lydområdet samt arbejde på data til GenAI-produkter vil være en fordel.

Hvilke teknologier vil jeg arbejde med i denne stilling?

Du vil arbejde med store datamængder, herunder video og audio, samt anvende Python til ren og vedligeholdelig kodning og workflow-orkestrering.

Stillinger

Senior Research EngineerData EngineerML Infrastructure Engineer

Lignende jobs