GPU Inference Optimization Jobs

Machine Learning Infrastructure

AI Infrastructure

gpu-inference

Model Serving

TL, Research Inference

OpenAI·San Francisco, California, United States (On-site)

OpenAI

San Francisco, California, United States (On-site)

$380K – $555K Yearly17h ago

research-engineering

high-performance-inference

model-execution

AI Inference Engineer (San Francisco)

Perplexity·San Francisco, California, United States (On-site)

Perplexity

San Francisco, California, United States (On-site)

$220K – $485K Yearly9h ago

AI Engineering

Rust

Audio Inference Engineer, Model Efficiency

Cohere·Canada + 4 more (Remote)

Cohere

Canada + 4 more (Remote)

9h ago

AI Infrastructure

LLM Inference Frameworks and Optimization Engineer

Together AI·San Francisco, California, United States (On-site)

Together AI

San Francisco, California, United States (On-site)

$160K – $230K Yearly17h ago

AI Research Engineer

TensorRT-LLM

vLLM

AI Inference Engineer (London)

Perplexity·London, England, United Kingdom (On-site)

Perplexity

London, England, United Kingdom (On-site)

9h ago

ai-inference-engineer

Rust

AI System Research and Development Engineer - Optimization

Snowflake·Bellevue, Washington, United States (On-site)

Snowflake

Bellevue, Washington, United States (On-site)

$200K – $265K Yearly17h ago

AI Research Engineer

Systems Engineering

gpu-kernel-optimization

ML Infrastructure Engineering

Software Engineer, Model Inference

OpenAI·San Francisco, California, United States (On-site)

OpenAI

San Francisco, California, United States (On-site)

$295K – $555K Yearly9h ago

Staff Technical Lead for Inference & ML Performance

fal.ai·San Francisco, California, United States (On-site)

fal.ai

San Francisco, California, United States (On-site)

17h ago

PyTorch

TensorRT

Performance Engineer, Inference Systems

Anthropic·San Francisco, California, United States (Hybrid)

Anthropic

San Francisco, California, United States (Hybrid)

$350K – $850K Yearly9h ago

Performance Engineering

inference-systems

SQL

Inference Technical Lead, On-Device Transformers

OpenAI·San Francisco, California, United States (Hybrid)

OpenAI

San Francisco, California, United States (Hybrid)

$445K – $445K Yearly17h ago

Machine Learning

ml-runtimes

Forward Deployed Engineer (Inference & Post-Training)

Together AI·San Francisco, California, United States (On-site)

Together AI

San Francisco, California, United States (On-site)

$270K – $300K Yearly1w ago

systems-research-engineer

AI/ML Engineering

vLLM

TensorRT-LLM

Software Engineer, Inference - Performance Optimization

OpenAI·San Francisco, California, United States (On-site)

OpenAI

San Francisco, California, United States (On-site)

$295K – $555K Yearly9h ago

scaling

inference

performance-profiling

Benchmarking

Systems Research Engineer Intern - GPU Programming (Fall 2026)

Together AI·San Francisco, California, United States (On-site)

Together AI

San Francisco, California, United States (On-site)

$58 – $63 Hourly17h ago

Systems Engineering

GPU Programming

Machine Learning Engineering

Research Intern, Inference (Fall 2026)

Together AI·San Francisco, California, United States (On-site)

Together AI

San Francisco, California, United States (On-site)

$58 – $63 Hourly17h ago

Director, Engineering - Inference Serving Engine

DigitalOcean·Bengaluru, Karnataka, India (Hybrid)

DigitalOcean

Bengaluru, Karnataka, India (Hybrid)

17h ago

Systems Research Engineer, GPU Programming

Together AI·San Francisco, California, United States (On-site)

Together AI

San Francisco, California, United States (On-site)

$160K – $230K Yearly17h ago

AI Research

GPU Programming