AI Engineer - Speech & NLP

Interhuman AI
Copenhagen,
Interhuman AI logo

Oversigt og nøgleindsigter

Interhuman AI søger en AI Engineer med speciale i tale og NLP til at udvikle modeller, der fanger nuancerne i menneskelig kommunikation i realtid. Stillingen involverer hele livscyklussen for modeludvikling og samarbejde med ingeniører for at opfylde realtidskrav.

Højdepunkter

  • Direkte indflydelse på den tekniske retning og produktudvikling
  • Konkurrencedygtig løn og aktier i en tidlig fase venture-backet virksomhed
  • Mulighed for fleksibel arbejdsplads og arrangementer

Påkrævede kvalifikationer

  • PhD i Maskinlæring, Datavidenskab eller relateret felt med fokus på tale- og NLP
  • Stærk erfaring med Python og PyTorch (eller JAX/TensorFlow)
  • Dokumenteret erfaring med at bygge og implementere modeller

Ønskværdige kvalifikationer

  • Familiaritet med nuværende tale- og multimodale modeller
  • Evne til at kommunikere komplekse arkitekturer til både tekniske og ikke-tekniske interessenter

Den ideale kandidat

Den ideelle kandidat er en selvstændig og struktureret person med en stærk baggrund inden for maskinlæring og en passion for menneskelig kommunikation. Kandidaten trives i et dynamisk miljø og har evnen til at prioritere opgaver effektivt.

Jobdetaljer

55000 - 65000 kr/måned
Fuldtid
37 timer/uge
Hybrid
Copenhagen

Jobbeskrivelse

Interhuman AI is building the next generation of social intelligence infrastructure—multimodal AI systems that understand not just what humans say, but how they say it. We're developing models that interpret behavioral signals like hesitation, engagement, confusion, and interest across voice, facial expressions, body language, and natural language - in real time. We're looking for an AI Scientist to join our core team and lead the development of models that capture the nuances of human communication in real time.

What you'll do

  • Design, train, and iterate on speech and language models that extract social and emotional signals from live conversation.

  • Own the full model development lifecycle—from data curation and architecture design through training, evaluation, and production deployment.

  • Build evaluation frameworks and benchmarks that capture the subtleties of human interaction that standard metrics miss.

  • Stay at the frontier of multimodal research and translate relevant advances into our production stack.

  • Collaborate closely with engineering to ensure models meet real-time latency and scalability requirements.

Who we're looking for

  • PhD in Machine Learning, Computer Science, or a related field with a focus on speech processing and/or NLP.

  • Track record of building and shipping models—publications are great, but we care equally about what you've built.

  • Strong proficiency in Python and deep experience with PyTorch (or JAX/TensorFlow).

  • Familiarity with the current landscape of speech and multimodal models (e.g., Whisper, audio-LLMs, speech encoders, vision-language models).

  • You thrive with ambiguity. You can scope your own work, prioritize ruthlessly, and know when to ask for input.

  • Clear communicator—you can explain a complex architecture to both engineers and non-technical stakeholders.

What we offer

  • Competitive salary and meaningful equity in an early-stage, venture-backed company.

  • Direct influence on technical direction—your work shapes the product, not just a feature.

  • A small, focused team where your contributions are visible and impactful from day one.

  • Flexibility on location and working arrangements.

Who we are

At Interhuman AI, we're pioneering multimodal AI that reads the full bandwidth of human communication - facial expressions, vocal tone, body language, and words - to interpret social signals in real time. We're building infrastructure for AI interactions that feel adaptive, emotionally aware, and genuinely human.

We're a small, focused team backed by top investors, with a working MVP and a vision to become foundational infrastructure for the next era of conversational AI.

If you want to do work that matters, at the edge of what's possible, we'd love to hear from you.

Karrierevej

Typisk karriereforløb

1

Senior AI Engineer

2

Lead AI Scientist

3

Director of AI Research

Vækstpotentiale

Som AI Engineer inden for Speech & NLP er der store muligheder for at avancere til højere stillinger, især i takt med at efterspørgslen efter avanceret AI-teknologi vokser. Med erfaring kan man også skifte fokus til ledelsesroller, hvor man kan styre teams og projekter.

Overførbare færdigheder

MaskinlæringDataanalyseKommunikationsfærdigheder

Branchekontekst

Stillingen som AI Engineer i multimodal AI er central i en branche, der konstant udvikler sig med nye teknologier og anvendelser. Med fokus på menneskelig kommunikation via AI er der et voksende behov for specialister, der kan integrere sociale og følelsesmæssige signaler i teknologiske løsninger.

Færdighedsanalyse

Kritiske færdigheder

PhD in Machine Learning

En doktorgrad i maskinlæring, datalogi eller et relateret felt med fokus på talebehandling og/eller NLP.

Model Development

Erfaring med at bygge og implementere modeller fra dataindsamling til produktion.

Python Programming

Stærk færdighed i Python med dyb erfaring i PyTorch (eller JAX/TensorFlow).

Vigtige færdigheder

Speech and Multimodal Models

Kendskab til nuværende landskab af tale- og multimodale modeller som Whisper og vision-sprog modeller.

Communication Skills

Evne til at kommunikere komplekse arkitekturer til både tekniske og ikke-tekniske interessenter.

Ønskværdige færdigheder

Problem Solving

Evne til at arbejde i usikre situationer, prioritere opgaver og søge input når nødvendigt.

Mest kritiske færdigheder

PhD in Machine LearningModel DevelopmentPython Programming

Sådan fremhæver du din erfaring

Fremhæv tidligere projekter, hvor du har designet og implementeret modeller inden for tale- og sprogbehandling. Beskriv hvordan dine tekniske færdigheder i Python og PyTorch har bidraget til succesfulde resultater i dine tidligere roller.

Interviewforberedelse

Sandsynlige spørgsmål

Kan du beskrive dit tidligere arbejde med tale- og sprogmodeller?

erfaring

Tip: Fokuser på specifikke projekter og resultater.

Hvordan vil du håndtere udfordringer ved at udvikle multimodale AI-systemer?

teknisk

Tip: Giv eksempler på problemer du har løst i tidligere projekter.

Hvordan prioriterer du opgaver i et projekt med mange usikkerheder?

situation

Tip: Vis dine evner til at skelne mellem vigtige og mindre vigtige opgaver.

Hvilke værktøjer og teknologier har du erfaring med i relation til NLP?

teknisk

Tip: Nævn specifikke værktøjer og hvordan du har anvendt dem.

Hvordan sikrer du, at dine modeller opfylder realtidskrav?

teknisk

Tip: Beskriv metoder til optimering og evaluering af modeller.

Kan du give et eksempel på, hvordan du har præsenteret komplekse data til ikke-tekniske interessenter?

kultur

Tip: Vis din evne til at kommunikere klart og effektivt.

Spørgsmål du kan stille

  • Hvilke nuværende udfordringer står teamet overfor i udviklingen af multimodale modeller?
  • Hvordan måler I succes for de modeller, der bliver udviklet?
  • Hvad er virksomhedens langsigtede vision for multimodal AI?

Tale punkter

  • Min erfaring med udvikling af NLP-modeller og hvordan de kan anvendes i praksis.
  • Vigtigheden af realtidsdata i multimodale AI-systemer.
  • Min evne til at arbejde i tværfaglige teams og kommunikere komplekse ideer.

Bekymringspunkter at være opmærksom på

  • Manglende erfaring med de nævnte teknologier som PyTorch eller TensorFlow.
  • Usikkerhed omkring hvordan man håndterer projektusikkerhed eller prioritering.

Ansøgningsstrategi

Ansøgningstips

  • Fremhæv relevant erfaring med at udvikle og implementere tale- og NLP-modeller i din ansøgning.
  • Vis din evne til at arbejde med multimodale data og forståelse for sociale signaler i kommunikation.
  • Inkluder konkrete eksempler på projekter, hvor du har arbejdet med realtidsmodeller og hvordan de har løst specifikke problemer.

Nøgleord at inkludere

MaskinlæringTalebehandlingMultimodal AINLPPythonPyTorch

Fokus i ansøgningen

Fremhæv din PhD i maskinlæring og relevante projekter, hvor du har arbejdet med tale- og multimodale modeller. Beskriv hvordan dine færdigheder vil bidrage til at udvikle AI, der forstår menneskelig kommunikation.

Tilpasning af CV

Tilpas dit CV ved at fokusere på projekter relateret til talegenkendelse og NLP, og inkluder specifikke resultater og teknologier, du har arbejdet med. Sørg for at nævne erfaring med PyTorch og andre relevante værktøjer.

Ofte stillede spørgsmål

Hvad indebærer stillingen som AI Engineer - Speech & NLP?

Stillingen indebærer at designe og træne multimodale AI-modeller, der forstår og tolker menneskelig kommunikation i realtid. Du vil arbejde med at udvikle modeller, der fanger sociale og følelsesmæssige signaler under live samtaler.

Hvilke kvalifikationer kræves for at ansøge?

Du skal have en PhD i Maskinlæring, Computer Science eller et beslægtet område med fokus på talebehandling eller NLP. Derudover kræves der stærke færdigheder i Python og erfaring med PyTorch eller JAX/TensorFlow.

Hvad tilbyder Interhuman AI i denne stilling?

Vi tilbyder en konkurrencedygtig løn, meningsfuld aktieandele i en tidlig fase, venture-finansieret virksomhed, samt direkte indflydelse på den tekniske retning. Du vil være en del af et lille, fokuseret team, hvor dine bidrag er synlige fra dag ét.

Hvordan er arbejdsmiljøet hos Interhuman AI?

Arbejdsmiljøet er præget af fleksibilitet og samarbejde i et lille team. Vi værdsætter klare kommunikationslinjer og muligheden for at arbejde med komplekse problemstillinger i et innovativt miljø.

Hvad er de primære forventninger til kandidaten?

Forventningerne inkluderer at kunne styre dit eget arbejde, prioritere opgaver effektivt samt bidrage til udviklingen af AI-modeller. Du skal være i stand til at kommunikere komplekse tekniske koncepter til både tekniske og ikke-tekniske interessenter.

Hvilken erfaring er vigtig for at trives i denne rolle?

Det er vigtigt at have en solid erfaring med at bygge og implementere modeller, samt at være fortrolig med de nuværende tendenser inden for taleforståelse og multimodale modeller. Evnen til at navigere i usikkerhed og selvstændigt definere arbejdsopgaver er også afgørende.

Hvilke teknologier vil jeg arbejde med?

Du vil arbejde med avancerede teknologier inden for AI, herunder talemodeller som Whisper, audio-LLMs og vision-sprog-modeller. Det er vigtigt at være opdateret med den aktuelle udvikling inden for disse områder.

Hvordan støtter Interhuman AI medarbejdernes udvikling?

Interhuman AI støtter medarbejdernes udvikling ved at give dem mulighed for at arbejde ved frontlinjen af multimodal forskning og ved at tilskynde til kontinuerlig læring og innovation gennem samarbejde med andre eksperter.

Stillinger

AI EngineerAI Scientist

Lignende jobs