Low-Latency Model Inference Jobs

Machine Learning Engineering

Model Inference

Distributed Systems

Audio Inference Engineer, Model Efficiency

Cohere·Canada + 4 more (Remote)

Cohere

Canada + 4 more (Remote)

16h ago

AI Infrastructure

Software Engineer, Model Inference

OpenAI·San Francisco, California, United States (On-site)

OpenAI

San Francisco, California, United States (On-site)

$295K – $555K Yearly16h ago

Performance Engineer, Inference Systems

Anthropic·San Francisco, California, United States (Hybrid)

Anthropic

San Francisco, California, United States (Hybrid)

$350K – $850K Yearly16h ago

Performance Engineering

inference-systems

SQL

AI Inference Engineer (London)

Perplexity·London, England, United Kingdom (On-site)

Perplexity

London, England, United Kingdom (On-site)

16h ago

ai-inference-engineer

Rust

Inference Technical Lead, Sora

OpenAI·San Francisco, California, United States (Hybrid)

OpenAI

San Francisco, California, United States (Hybrid)

$380K – $380K Yearly16h ago

ML Infrastructure Engineering

AI Infrastructure

gpu-inference

Model Serving

Research Intern, Inference (Fall 2026)

Together AI·San Francisco, California, United States (On-site)

Together AI

San Francisco, California, United States (On-site)

$58 – $63 Hourly1d ago

Staff Technical Lead for Inference & ML Performance

fal.ai·San Francisco, California, United States (On-site)

fal.ai

San Francisco, California, United States (On-site)

1d ago

PyTorch

TensorRT

Staff Research Engineer, Model Efficiency

Cohere·Worldwide (Remote)

Cohere

Worldwide (Remote)

16h ago

modeling

Machine Learning

model-architecture

Forward Deployed Engineer (Inference & Post-Training)

Together AI·San Francisco, California, United States (On-site)

Together AI

San Francisco, California, United States (On-site)

$270K – $300K Yearly1w ago

AI/ML Engineering

vLLM

TensorRT-LLM

LLM Inference Frameworks and Optimization Engineer

Together AI·San Francisco, California, United States (On-site)

Together AI

San Francisco, California, United States (On-site)

$160K – $230K Yearly1d ago

AI Research Engineer

TensorRT-LLM

vLLM

AI Inference Engineer (San Francisco)

Perplexity·San Francisco, California, United States (On-site)

Perplexity

San Francisco, California, United States (On-site)

$220K – $485K Yearly16h ago

AI Engineering

Rust

Software Engineer, Inference – AMD GPU Enablement

OpenAI·San Francisco, California, United States (On-site)

OpenAI

San Francisco, California, United States (On-site)

$295K – $555K Yearly16h ago

Inference Technical Lead, On-Device Transformers

OpenAI·San Francisco, California, United States (Hybrid)

OpenAI

San Francisco, California, United States (Hybrid)

$445K – $445K Yearly1d ago

Machine Learning